انویدیا از مدل هوش مصنوعی جدید خود با نام Latte3D در کنفرانس GTC 2024 رونمایی کرد. این هوش مصنوعی یک مدل سه بعدی با دستورات متنی ایجاد می کند.
به گزارش تکنوک، انویدیا از مدل جدید هوش مصنوعی Latte3D رونمایی کرد. مانند ChatGPT، Latte3D به اندازه کافی قدرتمند است که بتواند مدل های سه بعدی را از متن توصیفی ایجاد کند و روش کار سازندگان محتوا را متحول کند. Latte3D بسیار سریعتر از مدل های قدیمی است و مانند یک چاپگر سه بعدی مجازی عمل می کند که می تواند برای تولیدکنندگان محتوا در بسیاری از صنایع خبرجو باشد.
به عنوان وبلاگ انویدیا اعلام شد که این غول کارت گرافیک در حال توسعه یک مدل هوش مصنوعی است که می تواند ورودی متن را دریافت کرده و آن را به مدل سه بعدی تبدیل کند. تا به حال، هوش مصنوعی عمدتاً به تصاویر و ویدیوهای دو بعدی محدود شده است. اما این پیشرفت می تواند شیوه استفاده از هوش مصنوعی در صنعت بازی های ویدیویی را متحول کند.
اگر یک توسعه دهنده بخواهد یک مدل سه بعدی از یک موضوع را به بازی خود اضافه کند، می تواند از Latte3D بخواهد که محتوای سه بعدی برای آنها تولید کند. سانجا فیدلر، معاون تحقیقات هوش مصنوعی انویدیا، درباره Latte3D گفت:
یک سال پیش تولید تصاویر سه بعدی با این کیفیت با کمک مدل های هوش مصنوعی یک ساعت طول کشید. اما اکنون این فرآیند حدود 10 تا 12 ثانیه طول می کشد. اکنون میتوانیم نتایج را با سرعتهای بسیار سریعتری ارائه کنیم و نسل جدیدی از تولید متن به تصویر سهبعدی تقریباً آنی را در اختیار سازندگان محتوا در صنایع مختلف قرار دهیم.
در دموی اولیه انویدیا از مدل Latte3D، استفاده از آن بسیار ساده به نظر می رسد. پس از دریافت توضیحات متنی کوتاه، هوش مصنوعی یک مدل سه بعدی تولید می کند و کمی بعد آن را با جزئیات بیشتر تکمیل می کند. در حالی که نتیجه نهایی به اندازه مدل سورا OpenAI واقع بینانه نیست، هدف این مدل رسیدن به آن سطح از واقعیت نیست. بلکه هدف تسریع روند تولید محتوا به جای ایجاد آن از ابتدا است.
هوش مصنوعی Latte3D گزینههای مختلفی را در اختیار کاربر قرار میدهد و انویدیا میگوید که این باگها را میتوان در عرض چند دقیقه برای کیفیت بهتر بهینه کرد. سپس میتوان طرحها را به پلتفرمهای مختلف مانند Omniverse انویدیا صادر کرد و مطابق با نتیجه مطلوب تنظیم کرد.
Nvidia با استفاده از پردازندههای گرافیکی Ada A100 Tensor Core، Latte3D را آموزش داده و از توضیحات متنی ChatGPT پشتیبانی میکند تا آن را برای تعامل با کاربران واقعی آماده کند.
در حال حاضر، Latte3D فقط می تواند مدل های سه بعدی از اشیاء و حیوانات را تولید کند. بنابراین به نظر می رسد در تشخیص حیوانات مختلف و بافت ها و انواع اجسام موفق باشد. انویدیا این قابلیت ها را با نشان دادن اشیایی مانند لک لک (قلاب بافی) تاجدار یا گربه ابوالهول اوریگامی به نمایش گذاشت. این مدل برای تشخیص گونه های مختلف آموزش داده شده است. بنابراین او می تواند تفاوت بین یک تازی ایتالیایی و یک شیبا هینو را تشخیص دهد.
آن دسته از تولیدکنندگان محتوا که میخواهند از Latte3D برای کارهای بیشتر استفاده کنند، میتوانند آن را بر روی مجموعه دادههای متفاوتی مانند گیاهان یا اشیاء خانگی آموزش دهند و بعداً از آن برای اهداف خود استفاده کنند.
اعلامیه های اخیر مربوط به استفاده از هوش مصنوعی در ساخت بازی، همگی کاملاً نوآورانه بوده اند و Latte3D انویدیا به لیست رو به رشد ابزارهایی پیوسته است که ممکن است روزی روند توسعه بازی را به کلی تغییر دهند.
به عنوان مثال، انویدیا اخیرا از شخصیت های غیرقابل بازی (NPC) با دیالوگ های تولید شده توسط هوش مصنوعی رونمایی کرده است. در همین حال، آخرین به روز رسانی موتور بازی سازی Unreal Engine می تواند به کمک یادگیری ماشینی، تصاویری با کیفیت فیلم در زمان واقعی در بازی ها تولید کند.
گفتگو در مورد این post