• تبلیغات
  • تماس با ما
شنبه, اردیبهشت ۱۲, ۱۴۰۵
  • ورود
خبرجو
  • صفحه اصلی
  • فرهنگ و هنر
  • تناسب اندام
  • فناوری
  • اقتصاد و سرمایه
  • سلامتی
  • شیوه زندگی
  • ارز دیجیتال
بدون نتیجه
مشاهده تمام نتایج
  • صفحه اصلی
  • فرهنگ و هنر
  • تناسب اندام
  • فناوری
  • اقتصاد و سرمایه
  • سلامتی
  • شیوه زندگی
  • ارز دیجیتال
بدون نتیجه
مشاهده تمام نتایج
خبرجو
بدون نتیجه
مشاهده تمام نتایج
صفحه اصلی فناوری

ربات چت GPT-4 همچنان غیرقابل اعتماد است

سامان پاکدل توسط سامان پاکدل
۲۶ مهر ۱۴۰۲
در فناوری
مدت زمان مطالعه: 1 دقیقه
0
ربات چت GPT 4 همچنان غیرقابل اعتماد است

تحقیقاتی که توسط مایکروسافت انجام شده است نشان می‌دهد کاربران می‌توانند مدل GPT-4 را به گونه‌ای فریب دهند که نتایج جانبدارانه را منتشر کند و اطلاعات شخصی را فاش کند.

به گزارش تکناک و بر اساس تحقیقاتی که توسط مایکروسافت حمایت می‌شوند، مدل زبانی بزرگ GPT-4 شرکت OpenAI ممکن است قابل اعتمادتر از GPT-3.5 باشد، اما همچنان در برابر شکستن محدودیت‌ها و تبعیضات آسیب‌پذیرتر است.

در این مقاله که توسط پژوهشگران دانشگاه ایلینویز ، دانشگاه استنفورد، دانشگاه کالیفرنیا در برکلی، مرکز ایمنی هوش مصنوعی و مایکروسافت تهیه شده است، به مدل GPT-4 امتیاز قابلیت اعتماد بالاتر از نسخه قبلی خود داده شده است. این بدان معناست که آنها متوجه شدند که در کلیت امور، GPT-4 بهتر در حفاظت از اطلاعات شخصی، جلوگیری از نتایج سمی مانند اطلاعات تبعیض‌آمیز و مقاومت در برابر حملات دشمنانه عمل می‌کند.

با این حال، این مدل ممکن است توسط کاربران دستور بگیرد که از تدابیر امنیتی صرف نظر کرده و اطلاعات شخصی و تاریخچه مکالمه را فاش کند. پژوهشگران متوجه شدند که کاربران می‌توانند از تدابیر امنیتی مربوط به GPT-4 عبور کنند زیرا این مدل “اطلاعات گمراه‌کننده را با دقت بیشتری دنبال می‌کند” و احتمالاً به دقت درخواست‌های بسیار پیچیده را دنبال می‌کند.

تیم پژوهشگران می‌گوید که این آسیب‌پذیری‌ها در محصولات مبتنی بر GPT-4 که به طور عمده در محصولات مایکروسافت استفاده می‌شوند، واقع نشده‌اند، زیرا “برنامه‌های هوش مصنوعی پایان یافته از روش‌های متنوعی برای کاهش آسیب‌های ممکن در سطح مدل فناوری استفاده می‌کنند”.

برای اندازه‌گیری قابلیت اعتماد، پژوهشگران نتایج را در چندین دسته بندی اندازه‌گیری کردند که شامل سمی بودن، کلیشه ها، حریم خصوصی، اخلاق ماشین، عدالت و قدرت در مقابله با آزمون‌های متخاصم بود.

برای آزمایش دسته‌بندی‌ها، پژوهشگران ابتدا با استفاده از پرسمان‌های استاندارد، GPT-3.5 و GPT-4 را آزمایش کردند، که شامل استفاده از کلماتی بود که ممکن است ممنوع شده باشند. سپس، پژوهشگران از پرسمان‌هایی استفاده کردند که طراحی شده بودند تا مدل را به شکستن محدودیت‌های سیاست محتوا تحریک کنند، بدون اینکه به طور صریح به سوی گروه‌های خاصی تبعیض آمیز باشد. در نهایت، پژوهشگران با آزمون‌هایی که قصد داشتند به طور عمدی آنها را به فراموشی تدابیر امنیتی بکشانند، به چالش کشیدند.

پژوهشگران اعلام کردند که نتایج تحقیق را با تیم OpenAI به اشتراک گذاشته‌اند.

“هدف ما این است که سایر اعضای جامعه پژوهشی را تشویق کنیم تا از این کار استفاده کنند و و بر اساس این کار، به طور پیشگیرانه از اقدامات خبیثانه توسط دشمنانی که از آسیب‌پذیری‌ها سوء‌استفاده می‌کنند، جلوگیری کنند”، تیم گفت: “این ارزیابی قابل اعتماد تنها یک نقطه شروع است و ما امیدواریم با دیگران همکاری کرده و بر مبنای یافته‌های آن کار کرده و مدل‌های قدرتمندتر و قابل اعتمادتری را در آینده ایجاد کنیم.”

پژوهشگران نتایج خود را منتشر کردند تا سایرین بتوانند یافته‌های آنها را بازآفرینی کنند.

مدل‌های هوش مصنوعی مانند GPT-4 اغلب در گروه‌بندی تیم قرمز قرار می‌گیرند، که در آن توسعه‌دهندگان چندین پرسمان را تست می‌کنند تا ببینند آیا نتایج ناخواسته‌ای تولید می‌کنند یا خیر. هنگامی که مدل برای اولین بار معرفی شد، سام التمن، مدیرعامل OpenAI، اعتراف کرد که GPT-4 “هنوز نقص و محدودیت‌هایی دارد”.

به دنبال آن، کمیسیون تجارت فدرال (FTC) برای بررسی احتمال آسیب به مصرف‌کنندگان مانند انتشار اطلاعات نادرست، در مورد OpenAI تحقیقاتی را آغاز کرده است.

نوشته ربات چت GPT-4 همچنان غیرقابل اعتماد است اولین بار در خبرجو – اخبار دنیای تکنولوژی. پدیدار شد.

پست قبلی

امکان درک احساسات در هنر تولید شده توسط هوش مصنوعی

پست‌ بعدی

با جدیدترین ربات چت هوش مصنوعی جهان آشنا شوید

سامان پاکدل

سامان پاکدل

مرتبط پست ها

فناوری

بهترین روش‌های سئو و GEO برای کسب‌وکارهای محلی

۲۴ فروردین ۱۴۰۵
معرفی مقاطع فولادی به کار رفته در اسکلت فلزی ساختمان و کاربرد آنها
فناوری

معرفی مقاطع فولادی به کار رفته در اسکلت فلزی ساختمان و کاربرد آنها

۰۵ اسفند ۱۴۰۴
سنسور حرکتی راه پله
فناوری

برد سنسور حرکتی چقدر است؟ بررسی محدوده تشخیص در سنسورهای مختلف

۰۴ اسفند ۱۴۰۴
3210bc35 f712 4e15 94ae ecb33d3fc30b
فناوری

پیشنهاد زمستانی آمارکتس؛ شرایط معاملاتی استثنایی برای پایان سال 1404

۰۱ اسفند ۱۴۰۴
بهترین ارائه کننده لوازم یدکی کامیون
فناوری

بهترین ارائه کننده لوازم یدکی کامیون

۲۸ بهمن ۱۴۰۴
آجر لفتون چیست [کاربرد و کارایی + مزایا و معایب]
فناوری

آجر لفتون چیست [کاربرد و کارایی + مزایا و معایب]

۲۷ بهمن ۱۴۰۴
بارگذاری بیشتر
پست‌ بعدی
با جدیدترین ربات چت هوش مصنوعی جهان آشنا شوید

با جدیدترین ربات چت هوش مصنوعی جهان آشنا شوید

گفتگو در مورد این post

توصیه شده

قیمت انواع آهن آلات ۲۴ اسفند ۱۴۰۲

قیمت انواع آهن آلات ۱۶ فروردین ۱۴۰۳

2 سال پیش
نحوه ساخت یک مکان کارامل ؛ دسر خوشمزه و خوشمزه

نحوه ساخت یک مکان کارامل ؛ دسر خوشمزه و خوشمزه برای افطار

1 سال پیش
افق میهن

رم به دنبال خرید سردار آزمون؛ لورکوزن باید تخفیف بدهد!

2 سال پیش
افق میهن

همزمان با نمایشگاه اکسپو 2024 تهران :: ایران تحلیل

2 سال پیش

از دست ندهید

بهترین روش‌های سئو و GEO برای کسب‌وکارهای محلی

۲۴ فروردین ۱۴۰۵

آیا بازار آهن در سال 1405 به ثبات می‌رسد؟

۲۳ فروردین ۱۴۰۵

پرینت سه بعدی سفارشی؛ راهکاری هوشمند برای ساخت قطعات خاص و کمیاب در کوتاه‌ترین زمان

۱۲ اسفند ۱۴۰۴
تور اقساطی استانبول، دبی و آنتالیا: سفری به یاد ماندنی با پرداخت آسان

تور اقساطی استانبول، دبی و آنتالیا: سفری به یاد ماندنی با پرداخت آسان

۰۶ اسفند ۱۴۰۴

دیگر رسانه ها

اجاره خودرو

خبرجو تازه‌ترین اخبار در سراسر دنیا در حوره های مالی , فرهنگی , اقتصادی و ... را برای شما به اشتراک خواهد گذاشت.

ما را دنبال کنید

اخبار اخیر

بهترین روش‌های سئو و GEO برای کسب‌وکارهای محلی

۲۴ فروردین ۱۴۰۵

آیا بازار آهن در سال 1405 به ثبات می‌رسد؟

۲۳ فروردین ۱۴۰۵

دسته بندی ها

  • ارز دیجیتال
  • اقتصاد و سرمایه
  • تناسب اندام
  • دسته‌بندی نشده
  • سلامتی
  • شیوه زندگی
  • فرهنگ و هنر
  • فناوری

همکاران

  • اخبار اقتصاد
  • تعمیرات موبایل تهران
  • بیت یونیکس
  • ال بانک
  • توبیت
  • آکادمی فارکس شایان
  • تبلیغات
  • تماس با ما

خوش آمدید!

به حساب خود در زیر وارد شوید

رمز عبور را فراموش کرده اید؟

رمز عبور خود را بازیابی کنید

لطفا نام کاربری یا آدرس ایمیل خود را برای بازنشانی رمز عبور خود وارد کنید.

ورود به سیستم
بدون نتیجه
مشاهده تمام نتایج
  • صفحه اصلی
  • فرهنگ و هنر
  • تناسب اندام
  • فناوری
  • اقتصاد و سرمایه
  • سلامتی
  • شیوه زندگی
  • ارز دیجیتال