• تبلیغات
  • تماس با ما
پنجشنبه, خرداد ۲۸, ۱۴۰۵
  • ورود
خبرجو
  • صفحه اصلی
  • فرهنگ و هنر
  • تناسب اندام
  • فناوری
  • اقتصاد و سرمایه
  • سلامتی
  • شیوه زندگی
  • ارز دیجیتال
بدون نتیجه
مشاهده تمام نتایج
  • صفحه اصلی
  • فرهنگ و هنر
  • تناسب اندام
  • فناوری
  • اقتصاد و سرمایه
  • سلامتی
  • شیوه زندگی
  • ارز دیجیتال
بدون نتیجه
مشاهده تمام نتایج
خبرجو
بدون نتیجه
مشاهده تمام نتایج
صفحه اصلی فناوری

ایجاد یک ابزار جدید برای حذف داده های خطرناک از مدل های هوش مصنوعی – One Knock

سامان پاکدل توسط سامان پاکدل
۲۱ اسفند ۱۴۰۲
در فناوری
مدت زمان مطالعه: 1 دقیقه
0
ایجاد یک ابزار جدید برای حذف داده های خطرناک از

گروهی از کارشناسان با ایجاد معیاری جدید به نام مجموعه داده‌های نماینده سلاح‌های کشتار جمعی (WMDP)، راهی برای غربال کردن اطلاعات خطرناک در مدل‌های هوش مصنوعی و حذف آن‌ها ارائه کرده‌اند.

گزارش کردن تنها هوش مصنوعی (AI)، مانند سایر فناوری‌ها مانند ویرایش ژن و انرژی هسته‌ای، می‌تواند برای اهداف خوب و بد استفاده شود. با توجه به مقدار زیادی پول و تلاشی که به سرعت در توسعه هوش مصنوعی سرمایه گذاری می شود، نگرانی هایی در مورد استفاده از مدل های زبان بزرگ (LLM) برای اهداف مخرب مانند توسعه سلاح وجود دارد.

برای درک و کاهش این خطرات، سازمان‌های دولتی و آزمایشگاه‌های هوش مصنوعی به طور یکسان درک و تولید محتوای مرتبط با موضوعات خطرناکی مانند امنیت زیستی، امنیت سایبری و امنیت شیمیایی را با مدل‌های زبان بزرگ اندازه‌گیری می‌کنند.

با این حال، این کار محرمانه و در حال حاضر خصوصی است، که واقعاً به هوش مصنوعی در گفتمان عمومی کمک نمی کند.

اکنون گروهی از کارشناسان معتقدند این محدودیت باید بازنگری شود. آنها یک معیار جدید به نام Dataset دارند WMDP (نماینده سلاح های کشتار جمعی).

ماهی دیجیتال

این مجموعه داده نه تنها راهی برای بررسی اینکه آیا یک مدل هوش مصنوعی دارای اطلاعات مخرب است ارائه می دهد، بلکه راهی برای حذف این اطلاعات مخرب در حالی که بقیه مدل دست نخورده باقی می ماند، پیشنهاد می کند.

چگونه کار می کند؟

محققان کار خود را با مشورت با کارشناسان امنیت زیستی، سلاح های شیمیایی و امنیت سایبری آغاز کردند. این کارشناسان تمام راه‌های احتمالی که ممکن است آسیب در حوزه‌های کاری خود رخ دهد را فهرست کرده‌اند.

سپس، آنها 4000 سوال چند گزینه ای برای سنجش دانش فرد در مورد چگونگی ایجاد این آسیب ها ایجاد کردند. آنها مطمئن شدند که سؤالات هیچ اطلاعات حساسی را که بتوان به صورت عمومی به اشتراک گذاشت، نشان نداد.

مجموعه داده WMDP دو هدف اصلی را دنبال می کند: اول، به عنوان راهی برای ارزیابی میزان درک مدل های زبان بزرگ از موضوعات خطرناک، و دوم، به عنوان معیاری برای توسعه روش هایی برای “فراموش کردن” این دانش از مدل ها.

این تیم همچنین روش جدیدی را به نام CUT معرفی کرد که همانطور که از نام آن پیداست، دانش خطرناک را از مدل‌های بزرگ زبان حذف می‌کند و در عین حال توانایی‌های عمومی آن‌ها را در زمینه‌های دیگر مانند زیست‌شناسی و علوم کامپیوتر حفظ می‌کند.

به طور کلی، هدف ارائه ابزاری به محققان برای ارزیابی و رسیدگی به خطرات مرتبط با استفاده از مدل‌های زبان بزرگ برای اهداف مخرب است.

کاخ سفید نگران است

کاخ سفید نگران عوامل مخربی است که از هوش مصنوعی برای تولید سلاح های خطرناک استفاده می کنند، بنابراین خواستار تحقیقات برای درک بهتر این خطر شده است.

در اکتبر 2023، پرزیدنت بایدن فرمان اجرایی را امضا کرد تا اطمینان حاصل شود که ایالات متحده نقش رهبری را در استفاده از پتانسیل و رسیدگی به خطرات مرتبط با هوش مصنوعی ایفا می کند.

این دستورالعمل ها هشت اصل و اولویت راهنما برای استفاده مسئولانه از هوش مصنوعی شامل ایمنی، امنیت، حریم خصوصی، برابری، حقوق مدنی، حمایت از مصرف کننده، توانمندسازی کارگران، نوآوری، رقابت و رهبری جهانی را ترسیم می کند.

«دولت من بالاترین اولویت را بر مدیریت توسعه و استفاده ایمن و مسئولانه از هوش مصنوعی می‌گذارد و بنابراین رویکردی هماهنگ و کاملاً فدرال برای انجام این کار اتخاذ می‌کند. در این فرمان اجرایی آمده است: توسعه سریع قابلیت‌های هوش مصنوعی، ایالات متحده را وادار می‌کند تا در این لحظه به خاطر امنیت، اقتصاد و جامعه پیشتاز باشد.

اما در حال حاضر، روش‌هایی که شرکت‌های هوش مصنوعی برای کنترل خروجی سیستم‌های خود استفاده می‌کنند، به راحتی دور زده می‌شوند. همچنین، آزمایش‌هایی برای بررسی اینکه آیا یک مدل هوش مصنوعی ممکن است خطرناک باشد، گران و زمان‌بر هستند.

دن هندریکس، مدیر اجرایی مرکز ایمنی هوش مصنوعی و اولین نویسنده این مطالعه، به مجله تایم گفت: “ما امیدواریم که این به عنوان یکی از معیارهای اصلی که همه توسعه دهندگان منبع باز مدل های خود را با آن مقایسه می کنند، اتخاذ شود.” چارچوب خوبی برای حداقل فشار دادن آنها به حداقل رساندن مسائل ایمنی.”

ماهی دیجیتالماهی دیجیتال
پست قبلی

این مدل دستبند مردانه هدیه ای مناسب برای همسران است

پست‌ بعدی

معجزه زیبایی با روکش دندان

سامان پاکدل

سامان پاکدل

مرتبط پست ها

رم چیست و بررسی انواع رم سرور اچ پی در ماهان شبکه ایرانیان
فناوری

رم چیست و بررسی انواع رم سرور اچ پی در ماهان شبکه ایرانیان

۲۵ خرداد ۱۴۰۵
کولر گری 12000 اینورتر | 5 سال گارانتی بی‌قید و شرط
فناوری

کولر گری 12000 اینورتر | 5 سال گارانتی بی‌قید و شرط

۲۳ خرداد ۱۴۰۵
چگونه از خودروی رنو خود مراقبت کنیم؟
فناوری

چگونه از خودروی رنو خود مراقبت کنیم؟

۱۸ خرداد ۱۴۰۵
HXglW9zFT7njhhjqSVeANY1eySDmwLuNUerQdltJ
فناوری

ژئوممبران pvc

۱۷ خرداد ۱۴۰۵
چطور با هوش مصنوعی وظایف سئو را سریع‌تر و دقیق‌تر انجام دهیم؟
فناوری

چطور با هوش مصنوعی وظایف سئو را سریع‌تر و دقیق‌تر انجام دهیم؟

۱۶ خرداد ۱۴۰۵
علت پریدن فیوز مینیاتوری چیست؟ از اضافه بار تا خرابی تجهیزات برق!
فناوری

علت پریدن فیوز مینیاتوری چیست؟ از اضافه بار تا خرابی تجهیزات برق!

۱۰ خرداد ۱۴۰۵
بارگذاری بیشتر
پست‌ بعدی
معجزه زیبایی با روکش دندان

معجزه زیبایی با روکش دندان

گفتگو در مورد این post

توصیه شده

1715368738 فیلم جدید ارباب حلقه ها در راه است

فیلم جدید ارباب حلقه ها در راه است!

2 سال پیش
چگونه دهک خود را تغییر دهیم؟ یارانه بگیران حتما

چگونه دهک خود را تغییر دهیم؟ / یارانه بگیران حتما مطالعه کنند

2 سال پیش
صف های طولانی خرید گوشت قرمز نتیجه زنجیره معیوب در

صف های طولانی خرید گوشت قرمز نتیجه زنجیره معیوب در عرضه است

2 سال پیش
One UI 6.1

ویژگی های جدید One UI 6.1 در راه است

3 سال پیش

از دست ندهید

ba2d12c3 dd3f 4c7c bbd8 021edf250fbd

تفاوت جویس و سالت نیکوتین؛ راهنمای انتخاب مایع مناسب

۲۸ خرداد ۱۴۰۵
رم چیست و بررسی انواع رم سرور اچ پی در ماهان شبکه ایرانیان

رم چیست و بررسی انواع رم سرور اچ پی در ماهان شبکه ایرانیان

۲۵ خرداد ۱۴۰۵
پادری آلومینیومی؛ انتخابی هوشمند برای ورودی ساختمان‌های مدرن

پادری آلومینیومی؛ انتخابی هوشمند برای ورودی ساختمان‌های مدرن

۲۴ خرداد ۱۴۰۵
کولر گری 12000 اینورتر | 5 سال گارانتی بی‌قید و شرط

کولر گری 12000 اینورتر | 5 سال گارانتی بی‌قید و شرط

۲۳ خرداد ۱۴۰۵

دیگر رسانه ها

اجاره خودرو

خبرجو تازه‌ترین اخبار در سراسر دنیا در حوره های مالی , فرهنگی , اقتصادی و ... را برای شما به اشتراک خواهد گذاشت.

ما را دنبال کنید

اخبار اخیر

ba2d12c3 dd3f 4c7c bbd8 021edf250fbd

تفاوت جویس و سالت نیکوتین؛ راهنمای انتخاب مایع مناسب

۲۸ خرداد ۱۴۰۵
رم چیست و بررسی انواع رم سرور اچ پی در ماهان شبکه ایرانیان

رم چیست و بررسی انواع رم سرور اچ پی در ماهان شبکه ایرانیان

۲۵ خرداد ۱۴۰۵

دسته بندی ها

  • ارز دیجیتال
  • اقتصاد و سرمایه
  • تناسب اندام
  • دسته‌بندی نشده
  • سلامتی
  • شیوه زندگی
  • فرهنگ و هنر
  • فناوری

همکاران

  • اخبار اقتصاد
  • تعمیرات موبایل تهران
  • بیت یونیکس
  • ال بانک
  • توبیت
  • آکادمی فارکس شایان
  • تبلیغات
  • تماس با ما

خوش آمدید!

به حساب خود در زیر وارد شوید

رمز عبور را فراموش کرده اید؟

رمز عبور خود را بازیابی کنید

لطفا نام کاربری یا آدرس ایمیل خود را برای بازنشانی رمز عبور خود وارد کنید.

ورود به سیستم
بدون نتیجه
مشاهده تمام نتایج
  • صفحه اصلی
  • فرهنگ و هنر
  • تناسب اندام
  • فناوری
  • اقتصاد و سرمایه
  • سلامتی
  • شیوه زندگی
  • ارز دیجیتال