• تبلیغات
  • تماس با ما
جمعه, آذر ۱۴, ۱۴۰۴
  • ورود
خبرجو
  • صفحه اصلی
  • فرهنگ و هنر
  • تناسب اندام
  • فناوری
  • اقتصاد و سرمایه
  • سلامتی
  • شیوه زندگی
  • ارز دیجیتال
بدون نتیجه
مشاهده تمام نتایج
  • صفحه اصلی
  • فرهنگ و هنر
  • تناسب اندام
  • فناوری
  • اقتصاد و سرمایه
  • سلامتی
  • شیوه زندگی
  • ارز دیجیتال
بدون نتیجه
مشاهده تمام نتایج
خبرجو
بدون نتیجه
مشاهده تمام نتایج
صفحه اصلی فناوری

کاهش هشدار دهنده در پاسخ های ChatGPT

سامان پاکدل توسط سامان پاکدل
۲۹ تیر ۱۴۰۲
در فناوری
مدت زمان مطالعه: 1 دقیقه
0
1689842259 کاهش هشدار دهنده در پاسخ های ChatGPT
1689842253 362 کاهش هشدار دهنده در پاسخ های ChatGPT

تحقیقات محققان نشان می دهد که کیفیت پاسخ های ChatGPT در دوره خاصی از سال جاری به طور قابل توجهی کاهش یافته و نگران کننده است.

گزارش کردن تکناکبه عنوان مثال، دقت شناسایی اعداد اول در ChatGPT-4 از مارس تا ژوئن 2023 از 97.6 درصد به 2.4 درصد کاهش یافته است.

در ماه ها اخیرا، شواهد شخصی و زمزمه های عمومی در مورد کاهش کیفیت پاسخ های ChatGPT افزایش یافته است. تیمی از محققان از دانشگاه استنفورد و دانشگاه کالیفرنیا در برکلی تصمیم گرفتند تا بررسی کنند که آیا واقعاً کاهش کیفیت رخ داده است و معیارهایی برای اندازه‌گیری مقیاس تغییرات نامطلوب ارائه دهند. به طور خلاصه، افت کیفیت ChatGPT مطمئناً انتظار نمی رفت.

سه محقق معروف، متی زاهاریا، لینجیائو چن و جیمز ژو، پشت این مقاله تحقیقاتی اخیرا منتشر شده با عنوان چگونه رفتار ChatGPT در طول زمان تغییر می کند؟ (PDF) بودند. صبح امروز، یو سی زهاریا، استاد علوم کامپیوتر، در توییتر به اشتراک گذاشتن یافته های تحقیق. او با تأکید شگفت‌انگیزی اعلام کرد که میزان موفقیت GPT-4 در «این بهترین است؟ «به ترتیب فکر کنید» از 97.6 درصد به 2.4 درصد از مارس تا ژوئن کاهش یافته است.

GPT-4 حدود دو هفته پیش در دسترس عموم قرار گرفت و به عنوان پیشرفته ترین و قدرتمندترین مدل OpenAI معرفی شد. این مدل به سرعت در دسترس توسعه دهندگان API قرار گرفت و ادعا کرد که می تواند به عنوان موتوری برای طیف وسیعی از محصولات خلاقانه هوش مصنوعی استفاده شود. بنابراین، جای تاسف و تعجب دارد که تحقیقات جدید نشان می‌دهد در برابر برخی سؤالات بسیار ساده، این مدل نتیجه غیرقابل قبولی در کیفیت پاسخ‌ها دارد.

ما در بالا به عنوان نمونه به نرخ شکست بی سابقه GPT-4 در سوالات اعداد اول اشاره کردیم. تیم تحقیقاتی وظیفه طراحی وظایفی را برای اندازه‌گیری جنبه‌های کیفی زیربنایی مدل‌های زبان بزرگ (LLM) GPT-4 و GPT-3.5 ChatGPT داشت. وظایف به چهار دسته تقسیم می شوند و انواع مهارت های هوش مصنوعی را اندازه گیری می کنند، در حالی که ارزیابی عملکرد نسبتاً ساده است.

  • حل مسائل ریاضی
  • پاسخگویی به سوالات حساس
  • تولید کد
  • استدلال بصری

نمای کلی عملکرد Open AI LLMs در نمودار زیر ارائه شده است. محققان عملکرد نسخه‌های GPT-4 و GPT-3.5 را در مارس 2023 و ژوئن 2023 ارزیابی کردند.

این نمودار به وضوح نشان می دهد که همان سرویس LLM در طول زمان به سؤالات کاملاً متفاوت پاسخ می دهد. در این دوره نسبتا کوتاه، تفاوت های قابل توجهی مشاهده می شود. هنوز مشخص نیست که این LLM ها چگونه به روز می شوند و آیا تغییرات برای بهبود برخی از جنبه های عملکرد آنها ممکن است بر سایرین تأثیر منفی بگذارد یا خیر. ببینید نسخه جدیدتر GPT-4 در مقایسه با نسخه مارس در سه دسته آزمایشی چقدر بدتر است. این نسخه فقط در استدلال بصری با اختلاف بسیار کمی برنده می شود.

کاهش هشدار دهنده در پاسخ های ChatGPT

برخی از افراد ممکن است نسبت به کیفیت متغیر مشاهده شده در همان نسخه LLM بی تفاوت باشند. با این حال، محققان خاطرنشان می کنند که به دلیل محبوبیت ChatGPT، هر دو GPT-4 و GPT-3.5 به طور گسترده توسط کاربران فردی و تعدادی از شرکت ها پذیرفته شده اند. بنابراین، خارج از محدوده احتمالی نیست که برخی از اطلاعات تولید شده توسط GPT بر زندگی شما تأثیر بگذارد.

1689842253 362 کاهش هشدار دهنده در پاسخ های ChatGPT

محققان قصد خود را برای ادامه ارزیابی نسخه های GPT در یک مطالعه طولانی مدت اعلام کرده اند. شاید هوش مصنوعی باز باید ارزیابی های کیفیت منظم را برای مشتریان پردرآمد خود نظارت و منتشر کند. اگر این موضوع شفاف‌تر نباشد، ممکن است لازم باشد سازمان‌های تجاری یا دولتی برخی از معیارهای کیفی اساسی این LLM‌ها را کنترل کنند، که می‌تواند تأثیرات قابل‌توجهی بر صنعت و تحقیقات داشته باشد.

پست کاهش هشدار دهنده در پاسخ های ChatGPT اولین بار در Tech Knock – اخبار دنیای فناوری ظاهر شد. ظاهر شد.

پست قبلی

توسعه بی هدف چت ربات هوش مصنوعی توسط اپل

پست‌ بعدی

آزمایشگاه Terraform مدیر عامل جدیدی را از تیم فعلی منصوب می کند

سامان پاکدل

سامان پاکدل

مرتبط پست ها

نرم افزار اصالت و رهگیری کالا - بهوان
فناوری

محافظت از برند با فناوری احراز هویت محصولات

۱۱ آذر ۱۴۰۴
تفاوت برند و نام تجاری
فناوری

تفاوت برند و نام تجاری چیست؟ نکاتی که اکثر کسب‌وکارها نمی‌دانند!

۱۱ آذر ۱۴۰۴
چگونه مدرک ICDL بگیریم؟ راهنمای جامع
فناوری

چگونه مدرک ICDL بگیریم؟ راهنمای جامع

۰۶ آذر ۱۴۰۴
403defc1 cd85 4d89 bb54 3e131d7a6c4f
فناوری

وقتی قیمت، تله معامله است: روش‌های فریب در معاملات خودرو

۰۵ آذر ۱۴۰۴
بهترین مهارت‌ها و تخصص‌های موردنیاز برای متخصص هوش مصنوعی
فناوری

بهترین مهارت‌ها و تخصص‌های موردنیاز برای متخصص هوش مصنوعی

۰۵ آذر ۱۴۰۴
خرید اقساطی مبلمان اداری هوگر
فناوری

فروش اقساطی محصولات مبلمان اداری هوگر با اعتبار اسنپ‌پی

۰۵ آذر ۱۴۰۴
بارگذاری بیشتر
پست‌ بعدی
Terraform Labs مدیر عامل جدیدی را از تیم موجود منصوب می کند

آزمایشگاه Terraform مدیر عامل جدیدی را از تیم فعلی منصوب می کند

گفتگو در مورد این post

توصیه شده

افق میهن

ورود و خروج سهامداران درصدی ۱۳ اسفند ۱۴۰۲

2 سال پیش
هشدار مسکو به آمریکا در مورد مصادره دارایی‌های روسیه

هشدار مسکو به آمریکا در مورد مصادره دارایی‌های روسیه

2 سال پیش
افق میهن

چگونه مصرف برق یخچال فریزر را کاهش دهیم؟

2 سال پیش
پالایشگاه نفت تهران با خرید سهام عمده پتروشیمی شازند به

پالایشگاه نفت تهران با خرید سهام عمده پتروشیمی شازند به پتروپالایشگاه بدل شد

2 سال پیش

از دست ندهید

چاق شدن صورت و زیر چشم

چاق شدن صورت و زیر چشم چگونه صورت خود را حجیم کنیم؟

۱۳ آذر ۱۴۰۴
رژیم فستینگ چند کیلو کم میکند؟

رژیم روزه داری چند کیلو کم می کند؟ | چگونه با روزه داری کاهش وزن را افزایش دهیم؟

۱۲ آذر ۱۴۰۴
1764762104 غذاهایی که شما را در طول روز سیر نگه می

غذاهایی که شما را در طول روز سیر نگه می دارند

۱۲ آذر ۱۴۰۴
فارکس سیتی پرو، بهترین سایت ترید فارکس در ایران 2025

فارکس سیتی پرو، بهترین سایت ترید فارکس در ایران 2025

۱۲ آذر ۱۴۰۴

دیگر رسانه ها

اجاره خودرو

خبرجو تازه‌ترین اخبار در سراسر دنیا در حوره های مالی , فرهنگی , اقتصادی و ... را برای شما به اشتراک خواهد گذاشت.

ما را دنبال کنید

اخبار اخیر

چاق شدن صورت و زیر چشم

چاق شدن صورت و زیر چشم چگونه صورت خود را حجیم کنیم؟

۱۳ آذر ۱۴۰۴
رژیم فستینگ چند کیلو کم میکند؟

رژیم روزه داری چند کیلو کم می کند؟ | چگونه با روزه داری کاهش وزن را افزایش دهیم؟

۱۲ آذر ۱۴۰۴

دسته بندی ها

  • ارز دیجیتال
  • اقتصاد و سرمایه
  • تناسب اندام
  • دسته‌بندی نشده
  • سلامتی
  • شیوه زندگی
  • فرهنگ و هنر
  • فناوری

همکاران

  • اخبار اقتصاد
  • تعمیرات موبایل تهران
  • بیت یونیکس
  • ال بانک
  • توبیت
  • تبلیغات
  • تماس با ما

خوش آمدید!

به حساب خود در زیر وارد شوید

رمز عبور را فراموش کرده اید؟

رمز عبور خود را بازیابی کنید

لطفا نام کاربری یا آدرس ایمیل خود را برای بازنشانی رمز عبور خود وارد کنید.

ورود به سیستم
بدون نتیجه
مشاهده تمام نتایج
  • صفحه اصلی
  • فرهنگ و هنر
  • تناسب اندام
  • فناوری
  • اقتصاد و سرمایه
  • سلامتی
  • شیوه زندگی
  • ارز دیجیتال