مدل متا کوچکتر Llama AI را راه اندازی می کند

متا ممکن است یک مدل کوچکتر از Llama AI را قبل از مدل بزرگتر منتشر کند. این مدل ها قبل از عرضه مدل اصلی در سال جاری عرضه خواهند شد.

به گفته TechNock، متا قصد دارد نسخه‌های کوچک‌تری از مدل بزرگ Llama خود را منتشر کند. زیرا شرکت ها به دنبال ارائه مدل های هوش مصنوعی مقرون به صرفه تری برای عموم هستند.

طبق گزارش The Information، این شرکت می خواهد دو نسخه کوچک از Llama 3 را در این ماه قبل از عرضه مدل اصلی در تابستان امسال عرضه کند. لبه او می نویسد، این حرکت بر روند رو به رشد توسعه دهندگان هوش مصنوعی تاکید می کند تا گزینه های سبک وزن مدل هوش مصنوعی را اضافه کنند.

پیش از این و در فوریه سال گذشته، متا نسخه کوچکتری از مدل Llama 2 خود را با نام Llama 2 7B معرفی کرد. گوگل همچنین در فوریه سال گذشته از خانواده مدل های Gemma رونمایی کرد و شرکت هوش مصنوعی فرانسوی Mistral مدل Mistral 7B را در اختیار دارد.

این مدل‌ها معمولاً نمی‌توانند رشته‌های طولانی دستورالعمل‌های کاربر را مدیریت کنند. اما آنها سریع تر، انعطاف پذیرتر و ارزان تر از مدل های معمولی کار می کنند. با این حال، اینها هنوز هم مدل‌های هوش مصنوعی قدرتمندی هستند که می‌توانند فایل‌های PDF و مکالمات را خلاصه کنند و کد بنویسند.

مدل های بزرگتر معمولاً برای کارهای پیچیده تری مانند تولید تصویر یا کارهایی که نیاز به اجرای چندین دستور دارند استفاده می شوند. از آنجایی که مدل های کوچک تنها با تعداد کمتری از پارامترها (داده هایی که از آنها یاد می گیرند) کار می کنند، به قدرت پردازش کمتری نیاز دارند و بنابراین مقرون به صرفه تر هستند.

مدل‌های سبک برای کاربرانی که لزوماً نمی‌خواهند از گستردگی یک مدل زبان بزرگ برای برنامه‌های خود استفاده کنند، جذاب هستند. مدل‌های کوچک‌تر اغلب می‌توانند در پروژه‌های خاصی مانند کمک کد یا در دستگاه‌هایی مانند تلفن‌ها یا لپ‌تاپ‌هایی که نمی‌توانند مصرف انرژی یک مدل هوش مصنوعی بزرگ‌تر را پشتیبانی کنند، به کار گرفته شوند.

Meta ظاهراً Llama 3 را در جولای 2024 در دسترس قرار خواهد داد. این مدل ممکن است بتواند به سؤالات بحث برانگیز پاسخ دهد که Llama 2 نمی تواند پاسخ دهد.