• تبلیغات
  • تماس با ما
پنجشنبه, تیر ۴, ۱۴۰۵
  • ورود
خبرجو
  • صفحه اصلی
  • فرهنگ و هنر
  • تناسب اندام
  • فناوری
  • اقتصاد و سرمایه
  • سلامتی
  • شیوه زندگی
  • ارز دیجیتال
بدون نتیجه
مشاهده تمام نتایج
  • صفحه اصلی
  • فرهنگ و هنر
  • تناسب اندام
  • فناوری
  • اقتصاد و سرمایه
  • سلامتی
  • شیوه زندگی
  • ارز دیجیتال
بدون نتیجه
مشاهده تمام نتایج
خبرجو
بدون نتیجه
مشاهده تمام نتایج
صفحه اصلی فناوری

جهش بزرگ اپل در هوش مصنوعی با مدل زبان چند رسانه ای بزرگ MM1 – One Knock

سامان پاکدل توسط سامان پاکدل
۲۷ اسفند ۱۴۰۲
در فناوری
مدت زمان مطالعه: 1 دقیقه
0
جهش بزرگ اپل در هوش مصنوعی با مدل زبان چند

محققان اپل با مدل جدید زبان چند رسانه ای بزرگ خود، MM1، روش های جدیدی را برای آموزش مدل های زبان بزرگ بر اساس متن و تصویر ایجاد کرده اند که منجر به سیستم های هوش مصنوعی قدرتمندتر و انعطاف پذیرتر می شود.

گزارش کردن تنها این تحقیق در مقاله ای با عنوان “MM1: روش ها، تجزیه و تحلیل و بینش از پیش آموزش مدل های زبان بزرگ چندوجهی” که به طور ناگهانی در این هفته در سایت قرار گرفت. arxiv.org منتشر شده، نشان می دهد که چگونه ترکیب دقیق انواع مختلف داده های آموزشی و ساختارهای مدل می تواند منجر به عملکرد پیشرفته در طیف گسترده ای از معیارهای هوش مصنوعی شود.

محققان توضیح می‌دهند: «ما نشان می‌دهیم که برای پیش‌آموزش چندوجهی در مقیاس بزرگ، استفاده از ترکیب دقیق توصیف تصویر، متن و تصویر در هم آمیخته، و داده‌های فقط متنی برای دستیابی به نتایج برتر در نمونه‌های متعدد در معیارهای مختلف حیاتی است. با آموزش مدل‌ها بر روی یک مجموعه داده متنوع که شامل اطلاعات بصری و زبانی می‌شود، مدل‌های MM1 توانستند در وظایفی مانند توصیف تصویر، پاسخ‌گویی به پرس و جوی تصویر، و استنتاج زبان طبیعی به خوبی عمل کنند.

مقیاس بندی اجزای بصری کلیدی است. محققان همچنین دریافتند که انتخاب رمزگذار تصویر و وضوح تصاویر ورودی تاثیر قابل توجهی بر عملکرد مدل دارد. آنها می‌گویند: «ما نشان می‌دهیم که رمزگذار تصویر، همراه با وضوح تصویر و تعداد نشانه‌های تصویر، تأثیر قابل‌توجهی دارد، در حالی که طراحی اتصال زبان و بینایی اهمیت نسبتاً کمی دارد». این نشان می‌دهد که مقیاس‌بندی و بهبود مستمر اجزای بصری این مدل‌های چندوجهی کلیدی برای دستیابی به پیشرفت‌های بیشتر خواهد بود.

این مدل در اندازه پارامترهای 3 میلیارد، 7 میلیارد و 30 میلیارد ارائه می شود. محققان از این مدل‌ها برای انجام آزمایش‌ها و شناسایی عوامل کلیدی مؤثر بر عملکرد استفاده کردند. جالب اینجاست که وضوح تصویر و تعداد تگ‌های تصویر تاثیر بیشتری نسبت به رابط‌های زبان بصری دارند و مجموعه داده‌های مختلف قبل از آموزش می‌توانند تاثیر قابل‌توجهی بر اثربخشی مدل داشته باشند.

ماهی دیجیتال

تیم تحقیقاتی با استفاده از معماری “مخلوط از متخصصان” و روش “دروازه دو طرفه” MM1 را با دقت ساختند. این رویکرد نه تنها نتایج عالی در معیارهای قبل از آموزش به دست آورد، بلکه به عملکرد قوی در معیارهای چند رسانه ای موجود نیز تبدیل شد. حتی پس از تنظیم دقیق برای کارهای خاص، مدل‌های MM1 همچنان عملکرد رقابتی خود را حفظ کردند.

Mixture of Experts (MoE) یک مدل یادگیری ماشینی است که مبتنی بر ایده ترکیب چندین مدل متخصص مختلف برای حل یک مشکل خاص است. در این روش هر متخصص وظیفه حل بخشی از مشکل را بر عهده دارد و یک شبکه دروازه ای وجود دارد که تعیین می کند برای هر نمونه داده کدام متخصص باید فعال شود.

دروازه باینری روشی در زمینه پردازش سیگنال دیجیتال و شبکه های عصبی مصنوعی است که برای کنترل جریان اطلاعات در یک سیستم استفاده می شود. این روش از دروازه هایی استفاده می کند که می توانند 0 (بسته) یا 1 (باز) باشند. این گیت ها به گونه ای طراحی شده اند که بتوانند جریان اطلاعات را بر اساس نیاز سیستم مدیریت کنند.

آزمایشات نشان داده است که مدل های MM1-3B-Chat و MM1-7B-Chat از اکثر رقبای خود در بازار بهتر عمل می کنند. این مدل ها به ویژه در کارهایی مانند VQAv2 (پاسخ به یک سوال بر اساس تصویر و متن)، TextVQA (پاسخ به یک سوال متنی در مورد یک تصویر) و ScienceQA (پاسخ به یک سوال علمی) می درخشند. با این حال، عملکرد کلی MM1 هنوز از مدل‌های Gemini گوگل یا GPT-4V OpenAI پیشی نمی‌گیرد (هنوز). در حالی که MM1 ممکن است هنوز رهبر مطلق نباشد، اما هنوز یک جهش قابل توجه برای اپل در زمینه هوش مصنوعی است. این شرکت همچنین اخیراً DarwinAI را خریداری کرده است، اطلاعات بیشتر در مورد آن را اینجا بخوانید.

ماهی دیجیتالماهی دیجیتال
پست قبلی

شیرینی ها قیمت مصوب ندارند اما گران نخرید

پست‌ بعدی

فیلتر بورس ۲۷ اسفندماه ۱۴۰۲

سامان پاکدل

سامان پاکدل

مرتبط پست ها

1f978242 056a 4948 be54 d9167f791679
فناوری

محبوب‌ترین رشته‌های مهندسی برای ایرانی‌ها در ترکیه کدامند؟ از معماری تا گرافیک

۰۲ تیر ۱۴۰۵
راهنمای هوشمندانه خرید کالای دیجیتال؛ چگونه در نوسانات بازار، گجت‌های مدرن را با بهترین قیمت بخریم؟
فناوری

راهنمای هوشمندانه خرید کالای دیجیتال؛ چگونه در نوسانات بازار، گجت‌های مدرن را با بهترین قیمت بخریم؟

۳۰ خرداد ۱۴۰۵
چگونه سرعت سایت را افزایش دهیم | با راهکار های عملی
فناوری

چگونه سرعت سایت را افزایش دهیم | با راهکار های عملی

۳۰ خرداد ۱۴۰۵
رم چیست و بررسی انواع رم سرور اچ پی در ماهان شبکه ایرانیان
فناوری

رم چیست و بررسی انواع رم سرور اچ پی در ماهان شبکه ایرانیان

۲۵ خرداد ۱۴۰۵
کولر گری 12000 اینورتر | 5 سال گارانتی بی‌قید و شرط
فناوری

کولر گری 12000 اینورتر | 5 سال گارانتی بی‌قید و شرط

۲۳ خرداد ۱۴۰۵
چگونه از خودروی رنو خود مراقبت کنیم؟
فناوری

چگونه از خودروی رنو خود مراقبت کنیم؟

۱۸ خرداد ۱۴۰۵
بارگذاری بیشتر
پست‌ بعدی
افق میهن

فیلتر بورس ۲۷ اسفندماه ۱۴۰۲

گفتگو در مورد این post

توصیه شده

ظرفیت افزایش ۴۰ درصدی صادرات تولیدات تجهیزات بیمارستانی؛ ‌راه توسعه

ظرفیت افزایش ۴۰ درصدی صادرات تولیدات تجهیزات بیمارستانی؛ ‌راه توسعه تولیدات داخلی را باز کنید

2 سال پیش
۹۲ هزار درگاه پرداخت اینترنتی و کارت اجاره‌ای مرتبط با قمار و شرط‌بندی مسدود شد

۹۲ هزار درگاه پرداخت اینترنتی و کارت اجاره‌ای مرتبط با قمار و شرط‌بندی مسدود شد

2 سال پیش
چرا طلا گران شد؟

چرا طلا گران شد؟

2 سال پیش
محیا دهقانی باز هم با لباس سریال مستوران

محیا دهقانی باز هم با لباس سریال مستوران!

2 سال پیش

از دست ندهید

1f978242 056a 4948 be54 d9167f791679

محبوب‌ترین رشته‌های مهندسی برای ایرانی‌ها در ترکیه کدامند؟ از معماری تا گرافیک

۰۲ تیر ۱۴۰۵
اشتباهاتی که صاحبان کسب‌وکار بدون کمک معتمد مالیاتی مرتکب می‌شوند

اشتباهاتی که صاحبان کسب‌وکار بدون کمک معتمد مالیاتی مرتکب می‌شوند

۳۱ خرداد ۱۴۰۵
هزینه ایمپلنت با بیمه تکمیلی دی 1405 | سقف تعهدات و جدول پوشش بیمه دی

هزینه ایمپلنت با بیمه تکمیلی دی 1405 | سقف تعهدات و جدول پوشش بیمه دی

۳۱ خرداد ۱۴۰۵
مواد اولیه پلیمری چگونه صنعت بسته‌بندی را متحول کرده‌اند؟

مواد اولیه پلیمری چگونه صنعت بسته‌بندی را متحول کرده‌اند؟

۳۱ خرداد ۱۴۰۵

دیگر رسانه ها

اجاره خودرو

خبرجو تازه‌ترین اخبار در سراسر دنیا در حوره های مالی , فرهنگی , اقتصادی و ... را برای شما به اشتراک خواهد گذاشت.

ما را دنبال کنید

اخبار اخیر

1f978242 056a 4948 be54 d9167f791679

محبوب‌ترین رشته‌های مهندسی برای ایرانی‌ها در ترکیه کدامند؟ از معماری تا گرافیک

۰۲ تیر ۱۴۰۵
اشتباهاتی که صاحبان کسب‌وکار بدون کمک معتمد مالیاتی مرتکب می‌شوند

اشتباهاتی که صاحبان کسب‌وکار بدون کمک معتمد مالیاتی مرتکب می‌شوند

۳۱ خرداد ۱۴۰۵

دسته بندی ها

  • ارز دیجیتال
  • اقتصاد و سرمایه
  • تناسب اندام
  • دسته‌بندی نشده
  • سلامتی
  • شیوه زندگی
  • فرهنگ و هنر
  • فناوری

همکاران

  • اخبار اقتصاد
  • تعمیرات موبایل تهران
  • بیت یونیکس
  • ال بانک
  • توبیت
  • آکادمی فارکس شایان
  • تبلیغات
  • تماس با ما

خوش آمدید!

به حساب خود در زیر وارد شوید

رمز عبور را فراموش کرده اید؟

رمز عبور خود را بازیابی کنید

لطفا نام کاربری یا آدرس ایمیل خود را برای بازنشانی رمز عبور خود وارد کنید.

ورود به سیستم
بدون نتیجه
مشاهده تمام نتایج
  • صفحه اصلی
  • فرهنگ و هنر
  • تناسب اندام
  • فناوری
  • اقتصاد و سرمایه
  • سلامتی
  • شیوه زندگی
  • ارز دیجیتال