مدل هوش مصنوعی سورا; جدیدترین شاهکار شرکت OpenAI

شرکت OpenAI یک مدل هوش مصنوعی جدید برای ایجاد ویدئو به نام Sora معرفی کرد.

گزارش کردن تکناک این شرکت ادعا می کند که Sora “می تواند صحنه های واقعی و خلاقانه را از طریق دستورات متنی ایجاد کند.”

این مدل تبدیل متن به ویدئو به کاربران اجازه می دهد تا بر اساس دستورات نوشته شده توسط کاربر، ویدئوهای یک دقیقه ای واقعی بسازند.

مطابق با پست وبلاگ OpenAI، مدل هوش مصنوعی Sora قادر به ایجاد “صحنه های پیچیده با شخصیت های متعدد، انواع خاص حرکت، و جزئیات سوژه و پس زمینه” است.

این شرکت همچنین خاطرنشان می‌کند که این مدل می‌تواند درک کند که اشیاء چگونه در دنیای فیزیکی وجود دارند، و همچنین «به‌طور دقیق لوازم جانبی را تفسیر کرده و شخصیت‌های جذابی را با احساسات پر جنب و جوش خلق می‌کند».

این مدل همچنین می‌تواند یک ویدیو بر اساس یک تصویر ثابت ایجاد کند و همچنین فریم‌های از دست رفته را در یک ویدیوی موجود پر کند یا آن را گسترش دهد.

دموهای ساخته شده توسط سورا در پست وبلاگ OpenAI شامل صحنه ای هوایی از کالیفرنیا در طول طوفان طلا، ویدیویی که به نظر می رسد از داخل قطار توکیو گرفته شده است، و موارد دیگر است.

بسیاری از آنها نشانه های روشنی از هوش مصنوعی دارند. OpenAI می گوید که این مدل ممکن است برای “شبیه سازی دقیق فیزیک یک صحنه پیچیده” مشکل داشته باشد، اما نتایج به طور کلی چشمگیر هستند.

چند سال پیش، مبدل‌های تصویر به متن هوش مصنوعی مانند Midjourney پیشرو در تبدیل کلمات به تصویر بودند. اما اخیراً ویدیو با سرعت قابل توجهی شروع به توسعه کرده است.

شرکت‌هایی مانند Runway و Pika مدل‌های متن‌به ویدئوی چشمگیر خود را به نمایش گذاشته‌اند و Lumiere گوگل نیز یکی از رقبای اصلی OpenAI در این زمینه است. مشابه Sora، Lumiere به کاربران ابزارهای تبدیل متن به ویدیو را می دهد و همچنین به آنها اجازه می دهد از یک تصویر ثابت یک ویدیو ایجاد کنند.

در حال حاضر، Sora فقط در اختیار «تیم‌های قرمز» OpenAI است که مدل را از نظر آسیب‌ها و خطرات احتمالی ارزیابی می‌کنند. OpenAI همچنین به برخی از هنرمندان، طراحان و فیلمسازان امکان دسترسی به Sora را برای بازخورد می دهد.

این شرکت خاطرنشان می کند که سورا ممکن است فیزیک یک صحنه پیچیده را به درستی شبیه سازی نکند و ممکن است برخی موارد علت و معلولی را به درستی تفسیر نکند.

اوایل این ماه، OpenAI اعلام کرد که واترمارک‌ها را به ابزار تبدیل متن به تصویر DALL-E خود اضافه می‌کند، اما خاطرنشان می‌کند که آنها «به راحتی قابل حذف هستند». مانند سایر محصولات هوش مصنوعی، OpenAI باید با عواقب ناشی از اشتباه گرفتن ویدیوهای تقلبی و واقعی توسط هوش مصنوعی با واقعیت مقابله کند.

نوشته شده توسط مدل هوش مصنوعی سورا; جدیدترین شاهکار شرکت OpenAI اولین بار در Tech Knock – اخبار دنیای فناوری. ظاهر شد.