• تبلیغات
  • تماس با ما
دوشنبه, آذر ۲۴, ۱۴۰۴
  • ورود
خبرجو
  • صفحه اصلی
  • فرهنگ و هنر
  • تناسب اندام
  • فناوری
  • اقتصاد و سرمایه
  • سلامتی
  • شیوه زندگی
  • ارز دیجیتال
بدون نتیجه
مشاهده تمام نتایج
  • صفحه اصلی
  • فرهنگ و هنر
  • تناسب اندام
  • فناوری
  • اقتصاد و سرمایه
  • سلامتی
  • شیوه زندگی
  • ارز دیجیتال
بدون نتیجه
مشاهده تمام نتایج
خبرجو
بدون نتیجه
مشاهده تمام نتایج
صفحه اصلی فناوری

جهش بزرگ اپل در هوش مصنوعی با مدل زبان چند رسانه ای بزرگ MM1 – One Knock

سامان پاکدل توسط سامان پاکدل
۲۷ اسفند ۱۴۰۲
در فناوری
مدت زمان مطالعه: 1 دقیقه
0
جهش بزرگ اپل در هوش مصنوعی با مدل زبان چند

محققان اپل با مدل جدید زبان چند رسانه ای بزرگ خود، MM1، روش های جدیدی را برای آموزش مدل های زبان بزرگ بر اساس متن و تصویر ایجاد کرده اند که منجر به سیستم های هوش مصنوعی قدرتمندتر و انعطاف پذیرتر می شود.

گزارش کردن تنها این تحقیق در مقاله ای با عنوان “MM1: روش ها، تجزیه و تحلیل و بینش از پیش آموزش مدل های زبان بزرگ چندوجهی” که به طور ناگهانی در این هفته در سایت قرار گرفت. arxiv.org منتشر شده، نشان می دهد که چگونه ترکیب دقیق انواع مختلف داده های آموزشی و ساختارهای مدل می تواند منجر به عملکرد پیشرفته در طیف گسترده ای از معیارهای هوش مصنوعی شود.

محققان توضیح می‌دهند: «ما نشان می‌دهیم که برای پیش‌آموزش چندوجهی در مقیاس بزرگ، استفاده از ترکیب دقیق توصیف تصویر، متن و تصویر در هم آمیخته، و داده‌های فقط متنی برای دستیابی به نتایج برتر در نمونه‌های متعدد در معیارهای مختلف حیاتی است. با آموزش مدل‌ها بر روی یک مجموعه داده متنوع که شامل اطلاعات بصری و زبانی می‌شود، مدل‌های MM1 توانستند در وظایفی مانند توصیف تصویر، پاسخ‌گویی به پرس و جوی تصویر، و استنتاج زبان طبیعی به خوبی عمل کنند.

مقیاس بندی اجزای بصری کلیدی است. محققان همچنین دریافتند که انتخاب رمزگذار تصویر و وضوح تصاویر ورودی تاثیر قابل توجهی بر عملکرد مدل دارد. آنها می‌گویند: «ما نشان می‌دهیم که رمزگذار تصویر، همراه با وضوح تصویر و تعداد نشانه‌های تصویر، تأثیر قابل‌توجهی دارد، در حالی که طراحی اتصال زبان و بینایی اهمیت نسبتاً کمی دارد». این نشان می‌دهد که مقیاس‌بندی و بهبود مستمر اجزای بصری این مدل‌های چندوجهی کلیدی برای دستیابی به پیشرفت‌های بیشتر خواهد بود.

این مدل در اندازه پارامترهای 3 میلیارد، 7 میلیارد و 30 میلیارد ارائه می شود. محققان از این مدل‌ها برای انجام آزمایش‌ها و شناسایی عوامل کلیدی مؤثر بر عملکرد استفاده کردند. جالب اینجاست که وضوح تصویر و تعداد تگ‌های تصویر تاثیر بیشتری نسبت به رابط‌های زبان بصری دارند و مجموعه داده‌های مختلف قبل از آموزش می‌توانند تاثیر قابل‌توجهی بر اثربخشی مدل داشته باشند.

ماهی دیجیتال

تیم تحقیقاتی با استفاده از معماری “مخلوط از متخصصان” و روش “دروازه دو طرفه” MM1 را با دقت ساختند. این رویکرد نه تنها نتایج عالی در معیارهای قبل از آموزش به دست آورد، بلکه به عملکرد قوی در معیارهای چند رسانه ای موجود نیز تبدیل شد. حتی پس از تنظیم دقیق برای کارهای خاص، مدل‌های MM1 همچنان عملکرد رقابتی خود را حفظ کردند.

Mixture of Experts (MoE) یک مدل یادگیری ماشینی است که مبتنی بر ایده ترکیب چندین مدل متخصص مختلف برای حل یک مشکل خاص است. در این روش هر متخصص وظیفه حل بخشی از مشکل را بر عهده دارد و یک شبکه دروازه ای وجود دارد که تعیین می کند برای هر نمونه داده کدام متخصص باید فعال شود.

دروازه باینری روشی در زمینه پردازش سیگنال دیجیتال و شبکه های عصبی مصنوعی است که برای کنترل جریان اطلاعات در یک سیستم استفاده می شود. این روش از دروازه هایی استفاده می کند که می توانند 0 (بسته) یا 1 (باز) باشند. این گیت ها به گونه ای طراحی شده اند که بتوانند جریان اطلاعات را بر اساس نیاز سیستم مدیریت کنند.

آزمایشات نشان داده است که مدل های MM1-3B-Chat و MM1-7B-Chat از اکثر رقبای خود در بازار بهتر عمل می کنند. این مدل ها به ویژه در کارهایی مانند VQAv2 (پاسخ به یک سوال بر اساس تصویر و متن)، TextVQA (پاسخ به یک سوال متنی در مورد یک تصویر) و ScienceQA (پاسخ به یک سوال علمی) می درخشند. با این حال، عملکرد کلی MM1 هنوز از مدل‌های Gemini گوگل یا GPT-4V OpenAI پیشی نمی‌گیرد (هنوز). در حالی که MM1 ممکن است هنوز رهبر مطلق نباشد، اما هنوز یک جهش قابل توجه برای اپل در زمینه هوش مصنوعی است. این شرکت همچنین اخیراً DarwinAI را خریداری کرده است، اطلاعات بیشتر در مورد آن را اینجا بخوانید.

ماهی دیجیتالماهی دیجیتال
پست قبلی

شیرینی ها قیمت مصوب ندارند اما گران نخرید

پست‌ بعدی

فیلتر بورس ۲۷ اسفندماه ۱۴۰۲

سامان پاکدل

سامان پاکدل

مرتبط پست ها

نرم افزار اصالت و رهگیری کالا - بهوان
فناوری

محافظت از برند با فناوری احراز هویت محصولات

۱۱ آذر ۱۴۰۴
تفاوت برند و نام تجاری
فناوری

تفاوت برند و نام تجاری چیست؟ نکاتی که اکثر کسب‌وکارها نمی‌دانند!

۱۱ آذر ۱۴۰۴
چگونه مدرک ICDL بگیریم؟ راهنمای جامع
فناوری

چگونه مدرک ICDL بگیریم؟ راهنمای جامع

۰۶ آذر ۱۴۰۴
403defc1 cd85 4d89 bb54 3e131d7a6c4f
فناوری

وقتی قیمت، تله معامله است: روش‌های فریب در معاملات خودرو

۰۵ آذر ۱۴۰۴
بهترین مهارت‌ها و تخصص‌های موردنیاز برای متخصص هوش مصنوعی
فناوری

بهترین مهارت‌ها و تخصص‌های موردنیاز برای متخصص هوش مصنوعی

۰۵ آذر ۱۴۰۴
خرید اقساطی مبلمان اداری هوگر
فناوری

فروش اقساطی محصولات مبلمان اداری هوگر با اعتبار اسنپ‌پی

۰۵ آذر ۱۴۰۴
بارگذاری بیشتر
پست‌ بعدی
افق میهن

فیلتر بورس ۲۷ اسفندماه ۱۴۰۲

گفتگو در مورد این post

توصیه شده

مشترکین سیم‌کارت‌های شاتل موبایل نوروز امسال هرروز عیدی می گیرند

مشترکین سیم‌کارت‌های شاتل موبایل نوروز امسال «هرروز» عیدی می گیرند

2 سال پیش
آیا قیمت سکه و طلا افزایش می یابد؟

آیا قیمت سکه و طلا افزایش می یابد؟

2 سال پیش
افق میهن

کاهش ۱۰‌درصدی مقرری‌بگیران بیمه بیکاری

2 سال پیش
نرخ بیکاری زمستان به ۸۶ درصد رسید کاهش ۱۱ درصدی

نرخ بیکاری زمستان به ۸.۶ درصد رسید| کاهش ۱.۱ درصدی نسبت به زمستان ۱۴۰۱

2 سال پیش

از دست ندهید

le error le

ارور LE ماشین لباسشویی ال جی

۲۴ آذر ۱۴۰۴
رژیم لاغری ۱۵ کیلو در یک ماه

رژیم کاهش وزن 15 کیلویی در یک ماه آیا امکان کاهش وزن 15 کیلویی در یک ماه وجود دارد؟

۲۳ آذر ۱۴۰۴
خودروبر تبریز؛ انتخابی مطمئن وقتی خودرو نیاز به مراقبت ویژه دارد

خودروبر تبریز؛ انتخابی مطمئن وقتی خودرو نیاز به مراقبت ویژه دارد

۲۳ آذر ۱۴۰۴
1765701928 بهترین دستگاه تمرین برای تمرین در منزل

بهترین دستگاه تمرین برای تمرین در منزل

۲۳ آذر ۱۴۰۴

دیگر رسانه ها

اجاره خودرو

خبرجو تازه‌ترین اخبار در سراسر دنیا در حوره های مالی , فرهنگی , اقتصادی و ... را برای شما به اشتراک خواهد گذاشت.

ما را دنبال کنید

اخبار اخیر

le error le

ارور LE ماشین لباسشویی ال جی

۲۴ آذر ۱۴۰۴
رژیم لاغری ۱۵ کیلو در یک ماه

رژیم کاهش وزن 15 کیلویی در یک ماه آیا امکان کاهش وزن 15 کیلویی در یک ماه وجود دارد؟

۲۳ آذر ۱۴۰۴

دسته بندی ها

  • ارز دیجیتال
  • اقتصاد و سرمایه
  • تناسب اندام
  • دسته‌بندی نشده
  • سلامتی
  • شیوه زندگی
  • فرهنگ و هنر
  • فناوری

همکاران

  • اخبار اقتصاد
  • تعمیرات موبایل تهران
  • بیت یونیکس
  • ال بانک
  • توبیت
  • تبلیغات
  • تماس با ما

خوش آمدید!

به حساب خود در زیر وارد شوید

رمز عبور را فراموش کرده اید؟

رمز عبور خود را بازیابی کنید

لطفا نام کاربری یا آدرس ایمیل خود را برای بازنشانی رمز عبور خود وارد کنید.

ورود به سیستم
بدون نتیجه
مشاهده تمام نتایج
  • صفحه اصلی
  • فرهنگ و هنر
  • تناسب اندام
  • فناوری
  • اقتصاد و سرمایه
  • سلامتی
  • شیوه زندگی
  • ارز دیجیتال