• تبلیغات
  • تماس با ما
پنجشنبه, خرداد ۲۸, ۱۴۰۵
  • ورود
خبرجو
  • صفحه اصلی
  • فرهنگ و هنر
  • تناسب اندام
  • فناوری
  • اقتصاد و سرمایه
  • سلامتی
  • شیوه زندگی
  • ارز دیجیتال
بدون نتیجه
مشاهده تمام نتایج
  • صفحه اصلی
  • فرهنگ و هنر
  • تناسب اندام
  • فناوری
  • اقتصاد و سرمایه
  • سلامتی
  • شیوه زندگی
  • ارز دیجیتال
بدون نتیجه
مشاهده تمام نتایج
خبرجو
بدون نتیجه
مشاهده تمام نتایج
صفحه اصلی فناوری

14 مدل Big Tongue در Street Fighter III با یکدیگر جنگیدند

سامان پاکدل توسط سامان پاکدل
۱۸ فروردین ۱۴۰۳
در فناوری
مدت زمان مطالعه: 1 دقیقه
0
14 مدل Big Tongue در Street Fighter III با یکدیگر

یکی از مهندسان داده ۱۴ ربات هوش مصنوعی در بازی Street Fighter III vs تا ببینید کدام مدل بهتر عمل می کند.

چند هفته پیش یک برنامه نویس فرانسوی به نام Stan Girard LLM Colosseum را معرفی کرد. این یک برنامه متن باز است که به کاربران امکان می دهد کیفیت مدل های زبان بزرگ (LLM) را ارزیابی و رتبه بندی کنند. ژیرارد در آزمایش اولیه خود، مدل های OpenAI را در مقابل مدل های MistralAI قرار داد تا ببیند کدام مدل عملکرد بهتری دارد.

در زیر، می‌توانید ویدئویی را مشاهده کنید که نشان می‌دهد این ابزار محک برای LLMها را نشان می‌دهد.

ماهی دیجیتال

wccftech او می نویسد که پس از اجرای اولیه این معیار با استفاده از LLM Colosseum، مهندس آمازون، Banjo Obayumi تصمیم گرفت 14 مدل LLM را در 314 مسابقه Street Fighter III با استفاده از سرویس هوش مصنوعی آمازون، Amazon Bedrock، در مقابل یکدیگر قرار دهد. . Obayomi از برنامه منبع باز و شبیه ساز Stan Girard که بازی Street Fighter Capcom را از سال 1997 اجرا می کرد برای اجرای این معیار استفاده کرد.

این شبیه ساز توسط پس زمینه مبارزه با هوش مصنوعی Diambra پشتیبانی می شود. برای شروع مسابقه، دو LLM به طور تصادفی انتخاب شدند تا کنترل شخصیت معروف «کن» را در دست بگیرند. سپس LLM Colosseum داده های وضعیت بازی را جمع آوری می کند و حرکات بازیکن را از LLM ها دریافت می کند و در نهایت این LLM ها حرکات انتخابی خود را در شبیه ساز اجرا می کنند.

با بررسی نتایج کلی منتشر شده توسط Obayomi، مشخص شد که مدل های کوچکتر LLM نسبت به مدل های بزرگتر عملکرد بهتری دارند. این احتمالاً به دلیل تاخیر کمتر است. به طوری که مدل های کلود آنتروپیک در صدر جدول عملکرد قرار گرفتند. این اقدام جدید یافته های جالبی را ارائه کرد. از جمله مواردی است که مدل ها سعی کردند دانش خود را برای انجام حرکات غیرممکن مانند «ترکیب با بیشترین ضربه» به کار گیرند.

همچنین، به نظر می‌رسد هر مدل در طول این معیار، سبک بازی خود را توسعه داده است. برخی از مدل ها رویکرد دفاعی داشتند. در حالی که برخی دیگر تهاجمی عمل کردند و حتی برخی از مدل ها حاضر به مبارزه نشدند. تماشای این نوع چت ربات‌های هوش مصنوعی و اینکه چقدر سریع می‌توانند با یکدیگر سازگار شوند، واقعاً جالب است. اگر علاقه مند به راه اندازی یک معیار مشابه هستید، این لینک دنبال کن

ماهی دیجیتالماهی دیجیتال
پست قبلی

روز خونین بورس در هفته اول!

پست‌ بعدی

قیمت انواع آهن آلات ۱۸ فروردین ۱۴۰۳

سامان پاکدل

سامان پاکدل

مرتبط پست ها

رم چیست و بررسی انواع رم سرور اچ پی در ماهان شبکه ایرانیان
فناوری

رم چیست و بررسی انواع رم سرور اچ پی در ماهان شبکه ایرانیان

۲۵ خرداد ۱۴۰۵
کولر گری 12000 اینورتر | 5 سال گارانتی بی‌قید و شرط
فناوری

کولر گری 12000 اینورتر | 5 سال گارانتی بی‌قید و شرط

۲۳ خرداد ۱۴۰۵
چگونه از خودروی رنو خود مراقبت کنیم؟
فناوری

چگونه از خودروی رنو خود مراقبت کنیم؟

۱۸ خرداد ۱۴۰۵
HXglW9zFT7njhhjqSVeANY1eySDmwLuNUerQdltJ
فناوری

ژئوممبران pvc

۱۷ خرداد ۱۴۰۵
چطور با هوش مصنوعی وظایف سئو را سریع‌تر و دقیق‌تر انجام دهیم؟
فناوری

چطور با هوش مصنوعی وظایف سئو را سریع‌تر و دقیق‌تر انجام دهیم؟

۱۶ خرداد ۱۴۰۵
علت پریدن فیوز مینیاتوری چیست؟ از اضافه بار تا خرابی تجهیزات برق!
فناوری

علت پریدن فیوز مینیاتوری چیست؟ از اضافه بار تا خرابی تجهیزات برق!

۱۰ خرداد ۱۴۰۵
بارگذاری بیشتر
پست‌ بعدی
قیمت انواع آهن آلات ۱۸ فروردین ۱۴۰۳

قیمت انواع آهن آلات ۱۸ فروردین ۱۴۰۳

گفتگو در مورد این post

توصیه شده

1717842114 ناشتا برای کبد چرب چه بخوریم؟

ناشتا برای کبد چرب چه بخوریم؟

2 سال پیش
برخورد برخط تعزیراتی با تخلفات نانواها در فازجدید یارانه آرد

برخورد برخط تعزیراتی با تخلفات نانواها در فازجدید یارانه آرد

2 سال پیش
باند دو نفره موبایل‌قاپی متلاشی شد

باند دو نفره موبایل‌قاپی متلاشی شد

2 سال پیش
1712059684 آخرین مهلت دریافت سکه اولین حراج مرکز مبادلات ارزی

آخرین مهلت دریافت سکه اولین حراج مرکز مبادلات ارزی

2 سال پیش

از دست ندهید

ba2d12c3 dd3f 4c7c bbd8 021edf250fbd

تفاوت جویس و سالت نیکوتین؛ راهنمای انتخاب مایع مناسب

۲۸ خرداد ۱۴۰۵
رم چیست و بررسی انواع رم سرور اچ پی در ماهان شبکه ایرانیان

رم چیست و بررسی انواع رم سرور اچ پی در ماهان شبکه ایرانیان

۲۵ خرداد ۱۴۰۵
پادری آلومینیومی؛ انتخابی هوشمند برای ورودی ساختمان‌های مدرن

پادری آلومینیومی؛ انتخابی هوشمند برای ورودی ساختمان‌های مدرن

۲۴ خرداد ۱۴۰۵
کولر گری 12000 اینورتر | 5 سال گارانتی بی‌قید و شرط

کولر گری 12000 اینورتر | 5 سال گارانتی بی‌قید و شرط

۲۳ خرداد ۱۴۰۵

دیگر رسانه ها

اجاره خودرو

خبرجو تازه‌ترین اخبار در سراسر دنیا در حوره های مالی , فرهنگی , اقتصادی و ... را برای شما به اشتراک خواهد گذاشت.

ما را دنبال کنید

اخبار اخیر

ba2d12c3 dd3f 4c7c bbd8 021edf250fbd

تفاوت جویس و سالت نیکوتین؛ راهنمای انتخاب مایع مناسب

۲۸ خرداد ۱۴۰۵
رم چیست و بررسی انواع رم سرور اچ پی در ماهان شبکه ایرانیان

رم چیست و بررسی انواع رم سرور اچ پی در ماهان شبکه ایرانیان

۲۵ خرداد ۱۴۰۵

دسته بندی ها

  • ارز دیجیتال
  • اقتصاد و سرمایه
  • تناسب اندام
  • دسته‌بندی نشده
  • سلامتی
  • شیوه زندگی
  • فرهنگ و هنر
  • فناوری

همکاران

  • اخبار اقتصاد
  • تعمیرات موبایل تهران
  • بیت یونیکس
  • ال بانک
  • توبیت
  • آکادمی فارکس شایان
  • تبلیغات
  • تماس با ما

خوش آمدید!

به حساب خود در زیر وارد شوید

رمز عبور را فراموش کرده اید؟

رمز عبور خود را بازیابی کنید

لطفا نام کاربری یا آدرس ایمیل خود را برای بازنشانی رمز عبور خود وارد کنید.

ورود به سیستم
بدون نتیجه
مشاهده تمام نتایج
  • صفحه اصلی
  • فرهنگ و هنر
  • تناسب اندام
  • فناوری
  • اقتصاد و سرمایه
  • سلامتی
  • شیوه زندگی
  • ارز دیجیتال