• تبلیغات
  • تماس با ما
دوشنبه, خرداد ۲۵, ۱۴۰۵
  • ورود
خبرجو
  • صفحه اصلی
  • فرهنگ و هنر
  • تناسب اندام
  • فناوری
  • اقتصاد و سرمایه
  • سلامتی
  • شیوه زندگی
  • ارز دیجیتال
بدون نتیجه
مشاهده تمام نتایج
  • صفحه اصلی
  • فرهنگ و هنر
  • تناسب اندام
  • فناوری
  • اقتصاد و سرمایه
  • سلامتی
  • شیوه زندگی
  • ارز دیجیتال
بدون نتیجه
مشاهده تمام نتایج
خبرجو
بدون نتیجه
مشاهده تمام نتایج
صفحه اصلی فناوری

مدل ترجمه گفتار به متن چندزبانه متا منتشر شد

سامان پاکدل توسط سامان پاکدل
۰۱ شهریور ۱۴۰۲
در فناوری
مدت زمان مطالعه: 1 دقیقه
0
مدل ترجمه گفتار به متن چندزبانه متا منتشر شد

متا مدل جدیدی از ترجمه گفتار به متن را با نام SeamlessM4T منتشر کرده است که تقریباً 100 زبان را ترجمه می‌کند. این اقدام جزئی از تلاش شرکت برای ساخت یک مترجم جهانی است.

به گزارش تکناک، این مدل زبانی قادر است گفتار به متن و متن به متن را برای تقریباً 100 زبان ترجمه کند. برای عملکردهای گفتار به گفتار و متن به گفتار، این مدل قادر به تشخیص 100 زبان ورودی است و آن‌ها را به 35 زبان خروجی تبدیل می‌کند.

این مدل تحت مجوز Creative Commons CC BY-NC 4.0 منتشر شده است و به محققان اجازه می دهد تا بر روی آن تکرار کنند. همچنین همراه با SeamlessM4T، متا نیز متادیتاهای مجموعه داده ترجمه باز SeamlessAlign را منتشر کرد.

متا  گفت: “ساختن یک مترجم چندزبانه جهانی، مانند Babel Fish داستانی در Hitchhiker’s Guide to the Galaxy، چالش برانگیز است زیرا سیستم‌های موجود گفتار به گفتار و گفتار به متن تنها بخش کوچکی از زبان‌های جهان را پوشش می‌دهند.”

Babel Fish در Hitchhiker’s Guide که توسط نویسنده Douglas Adams ابداع شده است، یک ماهی است که می‌توانید آن را در گوش خود قرار داده و فوری هر زبانی را درک کنید. اگر طرفدار  Doctor Who هستید، می‌توانید این ابزار متا را با ماتریس ترجمه در TARDIS مقایسه کنید که حتی کلمات خارجی را به انگلیسی تبدیل می‌کند.

متا گفت SeamlessM4T نشان دهنده “پیشرفت قابل توجهی” است زیرا این مدل جدید کل کار ترجمه را یکجا انجام می دهد، برخلاف سایر مدل های ترجمه بزرگ که ترجمه را در سیستم های مختلف تقسیم می کنند.

یکی از ویژگی‌های جالب SeamlessM4T، اگر بتواند به درستی عمل کند، قابلیت تشخیص کدسوئیچ کردن یا تغییر زبان توسط یک سخنران یا هنگامی که فردی در یک جمله بین دو یا چند زبان حرکت می‌کند است. به عنوان مثال، متا در یک ویدیو نشان داد که این مدل بین زبان هندی، تلوگو و انگلیسی تفاوت را در کمترین زمان ممکن تشخیص می‌دهد.

SeamlessM4T بر مدل‌های ترجمه قبلی متا تکیه می‌کند. در سال گذشته، متا مدل ترجمه متن به متن بدون ترک زبان را منتشر کرد که پشتیبانی از 200 زبان را داشت.

این شرکت مجموعه داده SpeechMatrix را برای ترجمه گفتار به گفتار چندزبانه و Massively Multilingual Speech برای تشخیص گفتار توسعه داد. متا در سال گذشته ترجمه‌گر گفتاری جهانی خود را نمونه‌برداری کرد و توانست زبان Hokkien، یکی از زبان‌های رایج در چین که سیستم نوشتار رسمی ندارد، را به انگلیسی تبدیل کند.

ترجمه زبان برای شرکت‌هایی مانند متا که هزاران نفر را برای مدیریت تعداد زیادی از پست‌های فیسبوک و اینستاگرام به زبان‌های مختلف استخدام می‌کنند، بسیار مهم است. اغلب زبان‌های غیراصلی تیم‌های کوچکتری دارند و معمولاً به مدیریت خودکاری که با این زبان‌ها به خوبی کار نمی‌کند، وابسته می‌شوند. اگر هوش مصنوعی به مجموعه داده‌های این زبان‌های کوچک‌تر دسترسی داشته باشد، می‌تواند ابزاری برای شرکت‌هایی مانند متا، برای بهبود اعتدال باشد.

برای ساخت SeamlessM4T، متا اعلام کرد که ابزارکار مدل‌سازی توالی Fairseq خود را بازطراحی کرده است تا مدل‌هایی با وزن کمتر ایجاد کند و بیشترین حجم اطلاعات را پردازش کند.

در حین توسعه SeamlessM4T، متا اعلام کرد که سیستمی را ساخته است که کلمات سمی یا حساس را شناسایی می‌کند. متا کلمات سمی را به عنوان مواردی تعریف می‌کند که “ترجمه ممکن است احساسات نفرت، خشونت، ناسزا یا سوءاستفاده را القا کند”. هدف این است که بتوان تشخیص داد که آیا ترجمه نهایی سمیت را که در متن اصلی وجود نداشته است، به متن وارد می‌کند یا خیر.

متا اعلام کرده است: “ما سمیت ناهماهنگ را در داده‌های آموزش فیلتر کردیم. اگر ورودی یا خروجی شامل مقادیر مختلفی از سمیت باشد، ما آن دنباله آموزشی را حذف می‌کنیم.”

همچنین، پژوهشگران سعی کرده‌اند مجموعه داده‌ها را تمیز کنند تا بتوانند به دقت بیشتری تشخیص دهند که هنگام استفاده از کلمات ناسزا، ترجمه نادرستی انجام شده است.

متا ادعا کرده است که این مدل نیز توانایی تشخیص تعصب جنسیتی در زبان‌ها را دارد و اعلام کرده است که مدل قادر است تعصب جنسیتی در ترجمه‌ها را به شیوه‌ای اندازه‌گیری کند. SeamlessM4T می‌تواند بررسی کند که آیا در جمله از شکل جنسیتی یک کلمه مثلاً “doctora” در زبان اسپانیایی استفاده شده است و در صورت لزوم به زبان هدف، بدون در نظر گرفتن قواعد گرامر جنسیتی معادل زن را تعیین کند.

نوشته مدل ترجمه گفتار به متن چندزبانه متا منتشر شد اولین بار در خبرجو – اخبار دنیای تکنولوژی. پدیدار شد.

پست قبلی

سامسونگ صفحه نمایش بدون حاشیه طراحی کرد

پست‌ بعدی

عرضه قریب الوقوع نسخه وب تردز

سامان پاکدل

سامان پاکدل

مرتبط پست ها

رم چیست و بررسی انواع رم سرور اچ پی در ماهان شبکه ایرانیان
فناوری

رم چیست و بررسی انواع رم سرور اچ پی در ماهان شبکه ایرانیان

۲۵ خرداد ۱۴۰۵
کولر گری 12000 اینورتر | 5 سال گارانتی بی‌قید و شرط
فناوری

کولر گری 12000 اینورتر | 5 سال گارانتی بی‌قید و شرط

۲۳ خرداد ۱۴۰۵
چگونه از خودروی رنو خود مراقبت کنیم؟
فناوری

چگونه از خودروی رنو خود مراقبت کنیم؟

۱۸ خرداد ۱۴۰۵
HXglW9zFT7njhhjqSVeANY1eySDmwLuNUerQdltJ
فناوری

ژئوممبران pvc

۱۷ خرداد ۱۴۰۵
چطور با هوش مصنوعی وظایف سئو را سریع‌تر و دقیق‌تر انجام دهیم؟
فناوری

چطور با هوش مصنوعی وظایف سئو را سریع‌تر و دقیق‌تر انجام دهیم؟

۱۶ خرداد ۱۴۰۵
علت پریدن فیوز مینیاتوری چیست؟ از اضافه بار تا خرابی تجهیزات برق!
فناوری

علت پریدن فیوز مینیاتوری چیست؟ از اضافه بار تا خرابی تجهیزات برق!

۱۰ خرداد ۱۴۰۵
بارگذاری بیشتر
پست‌ بعدی
1692786922 عرضه قریب الوقوع نسخه وب تردز

عرضه قریب الوقوع نسخه وب تردز

گفتگو در مورد این post

توصیه شده

افق میهن

انتقاد جدی جبرائیلی به وضعیت هزینه‌کرد دولت؛ به داشتن کمترین رفاه عمومی می بالید!

2 سال پیش
کشاورزان با فراهم سازی بستری مناسب در مصرف بهینه آب

کشاورزان با فراهم سازی بستری مناسب در مصرف بهینه آب گام بردارند

2 سال پیش
آیا گوشت گران می شود؟

آیا گوشت گران می شود؟

2 سال پیش
لحظه دلخراش مرگ خدمه کشتی در پی در رفتن لنگر

لحظه دلخراش مرگ خدمه کشتی در پی در رفتن لنگر

2 سال پیش

از دست ندهید

رم چیست و بررسی انواع رم سرور اچ پی در ماهان شبکه ایرانیان

رم چیست و بررسی انواع رم سرور اچ پی در ماهان شبکه ایرانیان

۲۵ خرداد ۱۴۰۵
پادری آلومینیومی؛ انتخابی هوشمند برای ورودی ساختمان‌های مدرن

پادری آلومینیومی؛ انتخابی هوشمند برای ورودی ساختمان‌های مدرن

۲۴ خرداد ۱۴۰۵
کولر گری 12000 اینورتر | 5 سال گارانتی بی‌قید و شرط

کولر گری 12000 اینورتر | 5 سال گارانتی بی‌قید و شرط

۲۳ خرداد ۱۴۰۵
لایفاتک؛ پنجره‌ای نوین به دنیای اقتصاد

لایفاتک؛ پنجره‌ای نوین به دنیای اقتصاد

۲۰ خرداد ۱۴۰۵

دیگر رسانه ها

اجاره خودرو

خبرجو تازه‌ترین اخبار در سراسر دنیا در حوره های مالی , فرهنگی , اقتصادی و ... را برای شما به اشتراک خواهد گذاشت.

ما را دنبال کنید

اخبار اخیر

رم چیست و بررسی انواع رم سرور اچ پی در ماهان شبکه ایرانیان

رم چیست و بررسی انواع رم سرور اچ پی در ماهان شبکه ایرانیان

۲۵ خرداد ۱۴۰۵
پادری آلومینیومی؛ انتخابی هوشمند برای ورودی ساختمان‌های مدرن

پادری آلومینیومی؛ انتخابی هوشمند برای ورودی ساختمان‌های مدرن

۲۴ خرداد ۱۴۰۵

دسته بندی ها

  • ارز دیجیتال
  • اقتصاد و سرمایه
  • تناسب اندام
  • دسته‌بندی نشده
  • سلامتی
  • شیوه زندگی
  • فرهنگ و هنر
  • فناوری

همکاران

  • اخبار اقتصاد
  • تعمیرات موبایل تهران
  • بیت یونیکس
  • ال بانک
  • توبیت
  • آکادمی فارکس شایان
  • تبلیغات
  • تماس با ما

خوش آمدید!

به حساب خود در زیر وارد شوید

رمز عبور را فراموش کرده اید؟

رمز عبور خود را بازیابی کنید

لطفا نام کاربری یا آدرس ایمیل خود را برای بازنشانی رمز عبور خود وارد کنید.

ورود به سیستم
بدون نتیجه
مشاهده تمام نتایج
  • صفحه اصلی
  • فرهنگ و هنر
  • تناسب اندام
  • فناوری
  • اقتصاد و سرمایه
  • سلامتی
  • شیوه زندگی
  • ارز دیجیتال