شرکت OpenAI یک مدل هوش مصنوعی جدید برای ایجاد ویدئو به نام Sora معرفی کرد.
گزارش کردن تکناک این شرکت ادعا می کند که Sora “می تواند صحنه های واقعی و خلاقانه را از طریق دستورات متنی ایجاد کند.”
این مدل تبدیل متن به ویدئو به کاربران اجازه می دهد تا بر اساس دستورات نوشته شده توسط کاربر، ویدئوهای یک دقیقه ای واقعی بسازند.
مطابق با پست وبلاگ OpenAI، مدل هوش مصنوعی Sora قادر به ایجاد “صحنه های پیچیده با شخصیت های متعدد، انواع خاص حرکت، و جزئیات سوژه و پس زمینه” است.
این شرکت همچنین خاطرنشان میکند که این مدل میتواند درک کند که اشیاء چگونه در دنیای فیزیکی وجود دارند، و همچنین «بهطور دقیق لوازم جانبی را تفسیر کرده و شخصیتهای جذابی را با احساسات پر جنب و جوش خلق میکند».
این مدل همچنین میتواند یک ویدیو بر اساس یک تصویر ثابت ایجاد کند و همچنین فریمهای از دست رفته را در یک ویدیوی موجود پر کند یا آن را گسترش دهد.
دموهای ساخته شده توسط سورا در پست وبلاگ OpenAI شامل صحنه ای هوایی از کالیفرنیا در طول طوفان طلا، ویدیویی که به نظر می رسد از داخل قطار توکیو گرفته شده است، و موارد دیگر است.
بسیاری از آنها نشانه های روشنی از هوش مصنوعی دارند. OpenAI می گوید که این مدل ممکن است برای “شبیه سازی دقیق فیزیک یک صحنه پیچیده” مشکل داشته باشد، اما نتایج به طور کلی چشمگیر هستند.
چند سال پیش، مبدلهای تصویر به متن هوش مصنوعی مانند Midjourney پیشرو در تبدیل کلمات به تصویر بودند. اما اخیراً ویدیو با سرعت قابل توجهی شروع به توسعه کرده است.
شرکتهایی مانند Runway و Pika مدلهای متنبه ویدئوی چشمگیر خود را به نمایش گذاشتهاند و Lumiere گوگل نیز یکی از رقبای اصلی OpenAI در این زمینه است. مشابه Sora، Lumiere به کاربران ابزارهای تبدیل متن به ویدیو را می دهد و همچنین به آنها اجازه می دهد از یک تصویر ثابت یک ویدیو ایجاد کنند.
در حال حاضر، Sora فقط در اختیار «تیمهای قرمز» OpenAI است که مدل را از نظر آسیبها و خطرات احتمالی ارزیابی میکنند. OpenAI همچنین به برخی از هنرمندان، طراحان و فیلمسازان امکان دسترسی به Sora را برای بازخورد می دهد.
این شرکت خاطرنشان می کند که سورا ممکن است فیزیک یک صحنه پیچیده را به درستی شبیه سازی نکند و ممکن است برخی موارد علت و معلولی را به درستی تفسیر نکند.
اوایل این ماه، OpenAI اعلام کرد که واترمارکها را به ابزار تبدیل متن به تصویر DALL-E خود اضافه میکند، اما خاطرنشان میکند که آنها «به راحتی قابل حذف هستند». مانند سایر محصولات هوش مصنوعی، OpenAI باید با عواقب ناشی از اشتباه گرفتن ویدیوهای تقلبی و واقعی توسط هوش مصنوعی با واقعیت مقابله کند.
نوشته شده توسط مدل هوش مصنوعی سورا; جدیدترین شاهکار شرکت OpenAI اولین بار در Tech Knock – اخبار دنیای فناوری. ظاهر شد.
گفتگو در مورد این post