• تبلیغات
  • تماس با ما
جمعه, آذر ۱۴, ۱۴۰۴
  • ورود
خبرجو
  • صفحه اصلی
  • فرهنگ و هنر
  • تناسب اندام
  • فناوری
  • اقتصاد و سرمایه
  • سلامتی
  • شیوه زندگی
  • ارز دیجیتال
بدون نتیجه
مشاهده تمام نتایج
  • صفحه اصلی
  • فرهنگ و هنر
  • تناسب اندام
  • فناوری
  • اقتصاد و سرمایه
  • سلامتی
  • شیوه زندگی
  • ارز دیجیتال
بدون نتیجه
مشاهده تمام نتایج
خبرجو
بدون نتیجه
مشاهده تمام نتایج
صفحه اصلی فناوری

جهش بزرگ اپل در هوش مصنوعی با مدل زبان چند رسانه ای بزرگ MM1 – One Knock

سامان پاکدل توسط سامان پاکدل
۲۷ اسفند ۱۴۰۲
در فناوری
مدت زمان مطالعه: 1 دقیقه
0
جهش بزرگ اپل در هوش مصنوعی با مدل زبان چند

محققان اپل با مدل جدید زبان چند رسانه ای بزرگ خود، MM1، روش های جدیدی را برای آموزش مدل های زبان بزرگ بر اساس متن و تصویر ایجاد کرده اند که منجر به سیستم های هوش مصنوعی قدرتمندتر و انعطاف پذیرتر می شود.

گزارش کردن تنها این تحقیق در مقاله ای با عنوان “MM1: روش ها، تجزیه و تحلیل و بینش از پیش آموزش مدل های زبان بزرگ چندوجهی” که به طور ناگهانی در این هفته در سایت قرار گرفت. arxiv.org منتشر شده، نشان می دهد که چگونه ترکیب دقیق انواع مختلف داده های آموزشی و ساختارهای مدل می تواند منجر به عملکرد پیشرفته در طیف گسترده ای از معیارهای هوش مصنوعی شود.

محققان توضیح می‌دهند: «ما نشان می‌دهیم که برای پیش‌آموزش چندوجهی در مقیاس بزرگ، استفاده از ترکیب دقیق توصیف تصویر، متن و تصویر در هم آمیخته، و داده‌های فقط متنی برای دستیابی به نتایج برتر در نمونه‌های متعدد در معیارهای مختلف حیاتی است. با آموزش مدل‌ها بر روی یک مجموعه داده متنوع که شامل اطلاعات بصری و زبانی می‌شود، مدل‌های MM1 توانستند در وظایفی مانند توصیف تصویر، پاسخ‌گویی به پرس و جوی تصویر، و استنتاج زبان طبیعی به خوبی عمل کنند.

مقیاس بندی اجزای بصری کلیدی است. محققان همچنین دریافتند که انتخاب رمزگذار تصویر و وضوح تصاویر ورودی تاثیر قابل توجهی بر عملکرد مدل دارد. آنها می‌گویند: «ما نشان می‌دهیم که رمزگذار تصویر، همراه با وضوح تصویر و تعداد نشانه‌های تصویر، تأثیر قابل‌توجهی دارد، در حالی که طراحی اتصال زبان و بینایی اهمیت نسبتاً کمی دارد». این نشان می‌دهد که مقیاس‌بندی و بهبود مستمر اجزای بصری این مدل‌های چندوجهی کلیدی برای دستیابی به پیشرفت‌های بیشتر خواهد بود.

این مدل در اندازه پارامترهای 3 میلیارد، 7 میلیارد و 30 میلیارد ارائه می شود. محققان از این مدل‌ها برای انجام آزمایش‌ها و شناسایی عوامل کلیدی مؤثر بر عملکرد استفاده کردند. جالب اینجاست که وضوح تصویر و تعداد تگ‌های تصویر تاثیر بیشتری نسبت به رابط‌های زبان بصری دارند و مجموعه داده‌های مختلف قبل از آموزش می‌توانند تاثیر قابل‌توجهی بر اثربخشی مدل داشته باشند.

ماهی دیجیتال

تیم تحقیقاتی با استفاده از معماری “مخلوط از متخصصان” و روش “دروازه دو طرفه” MM1 را با دقت ساختند. این رویکرد نه تنها نتایج عالی در معیارهای قبل از آموزش به دست آورد، بلکه به عملکرد قوی در معیارهای چند رسانه ای موجود نیز تبدیل شد. حتی پس از تنظیم دقیق برای کارهای خاص، مدل‌های MM1 همچنان عملکرد رقابتی خود را حفظ کردند.

Mixture of Experts (MoE) یک مدل یادگیری ماشینی است که مبتنی بر ایده ترکیب چندین مدل متخصص مختلف برای حل یک مشکل خاص است. در این روش هر متخصص وظیفه حل بخشی از مشکل را بر عهده دارد و یک شبکه دروازه ای وجود دارد که تعیین می کند برای هر نمونه داده کدام متخصص باید فعال شود.

دروازه باینری روشی در زمینه پردازش سیگنال دیجیتال و شبکه های عصبی مصنوعی است که برای کنترل جریان اطلاعات در یک سیستم استفاده می شود. این روش از دروازه هایی استفاده می کند که می توانند 0 (بسته) یا 1 (باز) باشند. این گیت ها به گونه ای طراحی شده اند که بتوانند جریان اطلاعات را بر اساس نیاز سیستم مدیریت کنند.

آزمایشات نشان داده است که مدل های MM1-3B-Chat و MM1-7B-Chat از اکثر رقبای خود در بازار بهتر عمل می کنند. این مدل ها به ویژه در کارهایی مانند VQAv2 (پاسخ به یک سوال بر اساس تصویر و متن)، TextVQA (پاسخ به یک سوال متنی در مورد یک تصویر) و ScienceQA (پاسخ به یک سوال علمی) می درخشند. با این حال، عملکرد کلی MM1 هنوز از مدل‌های Gemini گوگل یا GPT-4V OpenAI پیشی نمی‌گیرد (هنوز). در حالی که MM1 ممکن است هنوز رهبر مطلق نباشد، اما هنوز یک جهش قابل توجه برای اپل در زمینه هوش مصنوعی است. این شرکت همچنین اخیراً DarwinAI را خریداری کرده است، اطلاعات بیشتر در مورد آن را اینجا بخوانید.

ماهی دیجیتالماهی دیجیتال
پست قبلی

شیرینی ها قیمت مصوب ندارند اما گران نخرید

پست‌ بعدی

فیلتر بورس ۲۷ اسفندماه ۱۴۰۲

سامان پاکدل

سامان پاکدل

مرتبط پست ها

نرم افزار اصالت و رهگیری کالا - بهوان
فناوری

محافظت از برند با فناوری احراز هویت محصولات

۱۱ آذر ۱۴۰۴
تفاوت برند و نام تجاری
فناوری

تفاوت برند و نام تجاری چیست؟ نکاتی که اکثر کسب‌وکارها نمی‌دانند!

۱۱ آذر ۱۴۰۴
چگونه مدرک ICDL بگیریم؟ راهنمای جامع
فناوری

چگونه مدرک ICDL بگیریم؟ راهنمای جامع

۰۶ آذر ۱۴۰۴
403defc1 cd85 4d89 bb54 3e131d7a6c4f
فناوری

وقتی قیمت، تله معامله است: روش‌های فریب در معاملات خودرو

۰۵ آذر ۱۴۰۴
بهترین مهارت‌ها و تخصص‌های موردنیاز برای متخصص هوش مصنوعی
فناوری

بهترین مهارت‌ها و تخصص‌های موردنیاز برای متخصص هوش مصنوعی

۰۵ آذر ۱۴۰۴
خرید اقساطی مبلمان اداری هوگر
فناوری

فروش اقساطی محصولات مبلمان اداری هوگر با اعتبار اسنپ‌پی

۰۵ آذر ۱۴۰۴
بارگذاری بیشتر
پست‌ بعدی
افق میهن

فیلتر بورس ۲۷ اسفندماه ۱۴۰۲

گفتگو در مورد این post

توصیه شده

تعرض سارق حرفه‌ای به زنان با تعرف شیرینی مسموم

تعرض سارق حرفه‌ای به زنان با تعرف شیرینی مسموم

2 سال پیش
1710582808 Ryzen 7 در بخش هوش مصنوعی دریاچه Meteor را شکست

Ryzen 7 در بخش هوش مصنوعی دریاچه Meteor را شکست داد

2 سال پیش
تصویر کامران کشاورز

حجم معاملات شمش طلا در مرکز مبادله از ٢ هزار میلیارد تومان گذشت

2 سال پیش
توییتر لینک به شبکه های اجتماعی رقیب را محدود کرد

توییتر لینک به شبکه های اجتماعی رقیب را محدود کرد

2 سال پیش

از دست ندهید

چاق شدن صورت و زیر چشم

چاق شدن صورت و زیر چشم چگونه صورت خود را حجیم کنیم؟

۱۳ آذر ۱۴۰۴
رژیم فستینگ چند کیلو کم میکند؟

رژیم روزه داری چند کیلو کم می کند؟ | چگونه با روزه داری کاهش وزن را افزایش دهیم؟

۱۲ آذر ۱۴۰۴
1764762104 غذاهایی که شما را در طول روز سیر نگه می

غذاهایی که شما را در طول روز سیر نگه می دارند

۱۲ آذر ۱۴۰۴
فارکس سیتی پرو، بهترین سایت ترید فارکس در ایران 2025

فارکس سیتی پرو، بهترین سایت ترید فارکس در ایران 2025

۱۲ آذر ۱۴۰۴

دیگر رسانه ها

اجاره خودرو

خبرجو تازه‌ترین اخبار در سراسر دنیا در حوره های مالی , فرهنگی , اقتصادی و ... را برای شما به اشتراک خواهد گذاشت.

ما را دنبال کنید

اخبار اخیر

چاق شدن صورت و زیر چشم

چاق شدن صورت و زیر چشم چگونه صورت خود را حجیم کنیم؟

۱۳ آذر ۱۴۰۴
رژیم فستینگ چند کیلو کم میکند؟

رژیم روزه داری چند کیلو کم می کند؟ | چگونه با روزه داری کاهش وزن را افزایش دهیم؟

۱۲ آذر ۱۴۰۴

دسته بندی ها

  • ارز دیجیتال
  • اقتصاد و سرمایه
  • تناسب اندام
  • دسته‌بندی نشده
  • سلامتی
  • شیوه زندگی
  • فرهنگ و هنر
  • فناوری

همکاران

  • اخبار اقتصاد
  • تعمیرات موبایل تهران
  • بیت یونیکس
  • ال بانک
  • توبیت
  • تبلیغات
  • تماس با ما

خوش آمدید!

به حساب خود در زیر وارد شوید

رمز عبور را فراموش کرده اید؟

رمز عبور خود را بازیابی کنید

لطفا نام کاربری یا آدرس ایمیل خود را برای بازنشانی رمز عبور خود وارد کنید.

ورود به سیستم
بدون نتیجه
مشاهده تمام نتایج
  • صفحه اصلی
  • فرهنگ و هنر
  • تناسب اندام
  • فناوری
  • اقتصاد و سرمایه
  • سلامتی
  • شیوه زندگی
  • ارز دیجیتال