• تبلیغات
  • تماس با ما
پنجشنبه, اسفند ۲۸, ۱۴۰۴
  • ورود
خبرجو
  • صفحه اصلی
  • فرهنگ و هنر
  • تناسب اندام
  • فناوری
  • اقتصاد و سرمایه
  • سلامتی
  • شیوه زندگی
  • ارز دیجیتال
بدون نتیجه
مشاهده تمام نتایج
  • صفحه اصلی
  • فرهنگ و هنر
  • تناسب اندام
  • فناوری
  • اقتصاد و سرمایه
  • سلامتی
  • شیوه زندگی
  • ارز دیجیتال
بدون نتیجه
مشاهده تمام نتایج
خبرجو
بدون نتیجه
مشاهده تمام نتایج
صفحه اصلی فناوری

جهش بزرگ اپل در هوش مصنوعی با مدل زبان چند رسانه ای بزرگ MM1 – One Knock

سامان پاکدل توسط سامان پاکدل
۲۷ اسفند ۱۴۰۲
در فناوری
مدت زمان مطالعه: 1 دقیقه
0
جهش بزرگ اپل در هوش مصنوعی با مدل زبان چند

محققان اپل با مدل جدید زبان چند رسانه ای بزرگ خود، MM1، روش های جدیدی را برای آموزش مدل های زبان بزرگ بر اساس متن و تصویر ایجاد کرده اند که منجر به سیستم های هوش مصنوعی قدرتمندتر و انعطاف پذیرتر می شود.

گزارش کردن تنها این تحقیق در مقاله ای با عنوان “MM1: روش ها، تجزیه و تحلیل و بینش از پیش آموزش مدل های زبان بزرگ چندوجهی” که به طور ناگهانی در این هفته در سایت قرار گرفت. arxiv.org منتشر شده، نشان می دهد که چگونه ترکیب دقیق انواع مختلف داده های آموزشی و ساختارهای مدل می تواند منجر به عملکرد پیشرفته در طیف گسترده ای از معیارهای هوش مصنوعی شود.

محققان توضیح می‌دهند: «ما نشان می‌دهیم که برای پیش‌آموزش چندوجهی در مقیاس بزرگ، استفاده از ترکیب دقیق توصیف تصویر، متن و تصویر در هم آمیخته، و داده‌های فقط متنی برای دستیابی به نتایج برتر در نمونه‌های متعدد در معیارهای مختلف حیاتی است. با آموزش مدل‌ها بر روی یک مجموعه داده متنوع که شامل اطلاعات بصری و زبانی می‌شود، مدل‌های MM1 توانستند در وظایفی مانند توصیف تصویر، پاسخ‌گویی به پرس و جوی تصویر، و استنتاج زبان طبیعی به خوبی عمل کنند.

مقیاس بندی اجزای بصری کلیدی است. محققان همچنین دریافتند که انتخاب رمزگذار تصویر و وضوح تصاویر ورودی تاثیر قابل توجهی بر عملکرد مدل دارد. آنها می‌گویند: «ما نشان می‌دهیم که رمزگذار تصویر، همراه با وضوح تصویر و تعداد نشانه‌های تصویر، تأثیر قابل‌توجهی دارد، در حالی که طراحی اتصال زبان و بینایی اهمیت نسبتاً کمی دارد». این نشان می‌دهد که مقیاس‌بندی و بهبود مستمر اجزای بصری این مدل‌های چندوجهی کلیدی برای دستیابی به پیشرفت‌های بیشتر خواهد بود.

این مدل در اندازه پارامترهای 3 میلیارد، 7 میلیارد و 30 میلیارد ارائه می شود. محققان از این مدل‌ها برای انجام آزمایش‌ها و شناسایی عوامل کلیدی مؤثر بر عملکرد استفاده کردند. جالب اینجاست که وضوح تصویر و تعداد تگ‌های تصویر تاثیر بیشتری نسبت به رابط‌های زبان بصری دارند و مجموعه داده‌های مختلف قبل از آموزش می‌توانند تاثیر قابل‌توجهی بر اثربخشی مدل داشته باشند.

ماهی دیجیتال

تیم تحقیقاتی با استفاده از معماری “مخلوط از متخصصان” و روش “دروازه دو طرفه” MM1 را با دقت ساختند. این رویکرد نه تنها نتایج عالی در معیارهای قبل از آموزش به دست آورد، بلکه به عملکرد قوی در معیارهای چند رسانه ای موجود نیز تبدیل شد. حتی پس از تنظیم دقیق برای کارهای خاص، مدل‌های MM1 همچنان عملکرد رقابتی خود را حفظ کردند.

Mixture of Experts (MoE) یک مدل یادگیری ماشینی است که مبتنی بر ایده ترکیب چندین مدل متخصص مختلف برای حل یک مشکل خاص است. در این روش هر متخصص وظیفه حل بخشی از مشکل را بر عهده دارد و یک شبکه دروازه ای وجود دارد که تعیین می کند برای هر نمونه داده کدام متخصص باید فعال شود.

دروازه باینری روشی در زمینه پردازش سیگنال دیجیتال و شبکه های عصبی مصنوعی است که برای کنترل جریان اطلاعات در یک سیستم استفاده می شود. این روش از دروازه هایی استفاده می کند که می توانند 0 (بسته) یا 1 (باز) باشند. این گیت ها به گونه ای طراحی شده اند که بتوانند جریان اطلاعات را بر اساس نیاز سیستم مدیریت کنند.

آزمایشات نشان داده است که مدل های MM1-3B-Chat و MM1-7B-Chat از اکثر رقبای خود در بازار بهتر عمل می کنند. این مدل ها به ویژه در کارهایی مانند VQAv2 (پاسخ به یک سوال بر اساس تصویر و متن)، TextVQA (پاسخ به یک سوال متنی در مورد یک تصویر) و ScienceQA (پاسخ به یک سوال علمی) می درخشند. با این حال، عملکرد کلی MM1 هنوز از مدل‌های Gemini گوگل یا GPT-4V OpenAI پیشی نمی‌گیرد (هنوز). در حالی که MM1 ممکن است هنوز رهبر مطلق نباشد، اما هنوز یک جهش قابل توجه برای اپل در زمینه هوش مصنوعی است. این شرکت همچنین اخیراً DarwinAI را خریداری کرده است، اطلاعات بیشتر در مورد آن را اینجا بخوانید.

ماهی دیجیتالماهی دیجیتال
پست قبلی

شیرینی ها قیمت مصوب ندارند اما گران نخرید

پست‌ بعدی

فیلتر بورس ۲۷ اسفندماه ۱۴۰۲

سامان پاکدل

سامان پاکدل

مرتبط پست ها

معرفی مقاطع فولادی به کار رفته در اسکلت فلزی ساختمان و کاربرد آنها
فناوری

معرفی مقاطع فولادی به کار رفته در اسکلت فلزی ساختمان و کاربرد آنها

۰۵ اسفند ۱۴۰۴
سنسور حرکتی راه پله
فناوری

برد سنسور حرکتی چقدر است؟ بررسی محدوده تشخیص در سنسورهای مختلف

۰۴ اسفند ۱۴۰۴
3210bc35 f712 4e15 94ae ecb33d3fc30b
فناوری

پیشنهاد زمستانی آمارکتس؛ شرایط معاملاتی استثنایی برای پایان سال 1404

۰۱ اسفند ۱۴۰۴
بهترین ارائه کننده لوازم یدکی کامیون
فناوری

بهترین ارائه کننده لوازم یدکی کامیون

۲۸ بهمن ۱۴۰۴
آجر لفتون چیست [کاربرد و کارایی + مزایا و معایب]
فناوری

آجر لفتون چیست [کاربرد و کارایی + مزایا و معایب]

۲۷ بهمن ۱۴۰۴
خرید رم لپ تاپ پاساژ نور
فناوری

خرید رم لپ تاپ از پاساژ نور؛ راهنمای کامل انتخاب، ارتقا و اطمینان از اصالت کالا

۲۵ بهمن ۱۴۰۴
بارگذاری بیشتر
پست‌ بعدی
افق میهن

فیلتر بورس ۲۷ اسفندماه ۱۴۰۲

گفتگو در مورد این post

توصیه شده

کاهش شدید قیمت طلا همچنان ادامه دارد

کاهش شدید قیمت طلا همچنان ادامه دارد

2 سال پیش
چهره "پروانه معصومی" در فیلم های قبل انقلاب شوکه تان می کند/ عکس

چهره «پروانه معصومی» در فیلم های قبلی انقلاب شما را شوکه می کند/عکس

3 سال پیش
Ryzen 8040 در مدل های در حال اجرا LLM بهتر

Ryzen 8040 در مدل های در حال اجرا LLM بهتر از Core Ultra عمل می کند

2 سال پیش
1753519033 پایگاه داده تخصصی حراج خودرو

پایگاه داده تخصصی حراج خودرو

8 ماه پیش

از دست ندهید

پرینت سه بعدی سفارشی؛ راهکاری هوشمند برای ساخت قطعات خاص و کمیاب در کوتاه‌ترین زمان

۱۲ اسفند ۱۴۰۴
تور اقساطی استانبول، دبی و آنتالیا: سفری به یاد ماندنی با پرداخت آسان

تور اقساطی استانبول، دبی و آنتالیا: سفری به یاد ماندنی با پرداخت آسان

۰۶ اسفند ۱۴۰۴
421789f0 5d52 4a79 ad90 c64d198121ee

چرا آبسردکن کف زمین را خیس می‌کند؟

۰۶ اسفند ۱۴۰۴
iAeFyA6sJueQvEgcq2t6UGo5iPLa8pO3DedTKKeJ

برای پاکسازی ریه چی بخوریم؟

۰۶ اسفند ۱۴۰۴

دیگر رسانه ها

اجاره خودرو

خبرجو تازه‌ترین اخبار در سراسر دنیا در حوره های مالی , فرهنگی , اقتصادی و ... را برای شما به اشتراک خواهد گذاشت.

ما را دنبال کنید

اخبار اخیر

پرینت سه بعدی سفارشی؛ راهکاری هوشمند برای ساخت قطعات خاص و کمیاب در کوتاه‌ترین زمان

۱۲ اسفند ۱۴۰۴
تور اقساطی استانبول، دبی و آنتالیا: سفری به یاد ماندنی با پرداخت آسان

تور اقساطی استانبول، دبی و آنتالیا: سفری به یاد ماندنی با پرداخت آسان

۰۶ اسفند ۱۴۰۴

دسته بندی ها

  • ارز دیجیتال
  • اقتصاد و سرمایه
  • تناسب اندام
  • دسته‌بندی نشده
  • سلامتی
  • شیوه زندگی
  • فرهنگ و هنر
  • فناوری

همکاران

  • اخبار اقتصاد
  • تعمیرات موبایل تهران
  • بیت یونیکس
  • ال بانک
  • توبیت
  • آکادمی فارکس شایان
  • تبلیغات
  • تماس با ما

خوش آمدید!

به حساب خود در زیر وارد شوید

رمز عبور را فراموش کرده اید؟

رمز عبور خود را بازیابی کنید

لطفا نام کاربری یا آدرس ایمیل خود را برای بازنشانی رمز عبور خود وارد کنید.

ورود به سیستم
بدون نتیجه
مشاهده تمام نتایج
  • صفحه اصلی
  • فرهنگ و هنر
  • تناسب اندام
  • فناوری
  • اقتصاد و سرمایه
  • سلامتی
  • شیوه زندگی
  • ارز دیجیتال