ابزار هوش مصنوعی جدید مایکروسافت به نام VASA-1 توسعه داده است که می تواند با استفاده از تصویر و فایل صوتی ویدیو تولید کند.
گزارش کردن تنهاهوش مصنوعی مولد به اختراع مجدد دنیای دیجیتال ما ادامه میدهد و هر چند وقت یکبار گامهای مهمی برمیدارد.
آخرین نوآوری مایکروسافت ممکن است پیشگامانه ترین و در عین حال ناراحت کننده ترین آن باشد.
VASA-1، هوش مصنوعی تصویر به ویدیو مایکروسافت، مرز بین ویدیوی واقعی و مصنوعی را محو می کند. این مدل می تواند ویدئوهای باورنکردنی و واقعی را تنها با تصاویر و فایل های صوتی تولید کند. به طوری که حرکات لب ها و حالات صورت کاملا طبیعی به نظر می رسد.
Android Authority او می نویسد که مایکروسافت کاملاً از قدرت VASA-1 آگاه است. این شرکت اشاره می کند که هوش مصنوعی مذکور نه تنها می تواند حرکت لب ها و صدا را به طور دقیق همگام کند. بلکه می تواند طیف وسیعی از احساسات و ظرافت های عاطفی صورت و حرکات طبیعی سر را به تصویر بکشد که به درک واقع گرایی و سرزندگی آن کمک می کند.
VASA-1 AI ویدیوهایی با وضوح مناسب (512 x 512) با نرخ فریم مناسب 45 فریم در ثانیه تولید می کند. جالبترین چیز این است که میتواند ویدیوهای چهره سخنگو با ظاهری طبیعی را فوراً با سرعت ۴۰ فریم بر ثانیه تولید کند.
کاربردهای بالقوه VASA-1 وسوسه انگیز است. با این حال، پتانسیل سوء استفاده به همان اندازه زیاد است. به این ترتیب، بلافاصله نگرانیهایی را در مورد دیپفیکهای بسیار معتبر ایجاد میکند که میتوانند اطلاعات نادرست را منتشر کنند و اعتماد عمومی را تضعیف کنند. مایکروسافت به خوبی از این موضوع آگاه است و تاکید می کند که این فناوری حداقل در حال حاضر تنها یک تلاش تحقیقاتی است.
خوشبختانه مایکروسافت همچنان معتقد است که به این زودی ها این فناوری قدرتمند را عرضه نخواهد کرد. برنامه این شرکت برای صبر کردن تا تصویب قوانین محدودکننده قابل تحسین است و باید به یک روش استاندارد برای کل صنعت فناوری تبدیل شود.
سرعت سرسام آور نوآوری و اثبات پیامدهای سیستم هایی مانند VASA-1 آن را به یک کار دلهره آور تبدیل می کند. اگر چنین ابزاری در دسترس عموم قرار گیرد، آیا موج جدیدی از خلاقیت و دسترسی را جرقه خواهد زد یا موج فزاینده بی اعتمادی و دستکاری را دامن می زند؟ نظر کاربران تکناک در مورد این موضوع چیست؟
گفتگو در مورد این post