متا ممکن است یک مدل کوچکتر از Llama AI را قبل از مدل بزرگتر منتشر کند. این مدل ها قبل از عرضه مدل اصلی در سال جاری عرضه خواهند شد.
به گفته TechNock، متا قصد دارد نسخههای کوچکتری از مدل بزرگ Llama خود را منتشر کند. زیرا شرکت ها به دنبال ارائه مدل های هوش مصنوعی مقرون به صرفه تری برای عموم هستند.
طبق گزارش The Information، این شرکت می خواهد دو نسخه کوچک از Llama 3 را در این ماه قبل از عرضه مدل اصلی در تابستان امسال عرضه کند. لبه او می نویسد، این حرکت بر روند رو به رشد توسعه دهندگان هوش مصنوعی تاکید می کند تا گزینه های سبک وزن مدل هوش مصنوعی را اضافه کنند.
پیش از این و در فوریه سال گذشته، متا نسخه کوچکتری از مدل Llama 2 خود را با نام Llama 2 7B معرفی کرد. گوگل همچنین در فوریه سال گذشته از خانواده مدل های Gemma رونمایی کرد و شرکت هوش مصنوعی فرانسوی Mistral مدل Mistral 7B را در اختیار دارد.
این مدلها معمولاً نمیتوانند رشتههای طولانی دستورالعملهای کاربر را مدیریت کنند. اما آنها سریع تر، انعطاف پذیرتر و ارزان تر از مدل های معمولی کار می کنند. با این حال، اینها هنوز هم مدلهای هوش مصنوعی قدرتمندی هستند که میتوانند فایلهای PDF و مکالمات را خلاصه کنند و کد بنویسند.
مدل های بزرگتر معمولاً برای کارهای پیچیده تری مانند تولید تصویر یا کارهایی که نیاز به اجرای چندین دستور دارند استفاده می شوند. از آنجایی که مدل های کوچک تنها با تعداد کمتری از پارامترها (داده هایی که از آنها یاد می گیرند) کار می کنند، به قدرت پردازش کمتری نیاز دارند و بنابراین مقرون به صرفه تر هستند.
مدلهای سبک برای کاربرانی که لزوماً نمیخواهند از گستردگی یک مدل زبان بزرگ برای برنامههای خود استفاده کنند، جذاب هستند. مدلهای کوچکتر اغلب میتوانند در پروژههای خاصی مانند کمک کد یا در دستگاههایی مانند تلفنها یا لپتاپهایی که نمیتوانند مصرف انرژی یک مدل هوش مصنوعی بزرگتر را پشتیبانی کنند، به کار گرفته شوند.
Meta ظاهراً Llama 3 را در جولای 2024 در دسترس قرار خواهد داد. این مدل ممکن است بتواند به سؤالات بحث برانگیز پاسخ دهد که Llama 2 نمی تواند پاسخ دهد.
گفتگو در مورد این post