xAI، رقیب OpenAI که توسط ایلان ماسک تأسیس شده است، نسخه جدیدی از هوش مصنوعی Grok خود را به نام Grok 1.5V معرفی کرده است که می تواند اطلاعات بصری را پردازش کند.
نسخه 1.5 ولتی Grok AI اولین نسل از هوش مصنوعی چندوجهی این شرکت است که می تواند نه تنها ورودی متن، بلکه اسناد، نمودارها، اسکرین شات ها و عکس ها را نیز پردازش کند.
xAI هنگام معرفی نسخه جدید Grok چند نمونه از کاربردهای آن در دنیای واقعی را توضیح داد. به عنوان مثال، میتوانید تصویری از یک فلوچارت را به گروک نشان دهید و از آن بخواهید که فلوچارت را به کد پایتون برای شما ترجمه کند، میتوانید از او بخواهید که یک داستان بر اساس نقاشی شما یا حتی از روی آن بنویسد. از او بخواهید معنی یک تصویر را برای شما توضیح دهد.
نسخه جدید Grok AI تنها چند هفته پس از رونمایی این شرکت از نسخه 1.5 خود عرضه شد. نسخه جدید برای عملکرد بهتر در کدنویسی و ریاضی نسبت به مدل قبلی طراحی شده است. همچنین میتواند مکالمات طولانیتری را پردازش کند تا بتواند دادهها را از منابع بیشتری برای درک بهتر سؤالات خاص بررسی کند.
به گفته شرکت xAI، کاربران فعلی این هوش مصنوعی و همچنین آزمایش کنندگان اولیه آن به زودی می توانند از قابلیت های نسخه 1.5 ولتی هوش مصنوعی Grok بهره مند شوند. اگرچه این شرکت زمان دقیقی برای عرضه نسخه جدید خود ارائه نکرده است.
این شرکت علاوه بر معرفی نسخه جدید هوش مصنوعی Grok، مجموعه RealWorldQA متشکل از 700 تصویر را برای ارزیابی مدل های هوش مصنوعی منتشر کرده است. شما می توانید از هر یک از این 700 تصویر برای بررسی و ارزیابی مدل های هوش مصنوعی استفاده کنید. هر تصویر حاوی پرسشها و پاسخهایی است که میتوانید به راحتی آنها را تأیید کنید، اما ممکن است مدلهای چندوجهی مانند Grok را با مشکل مواجه کرده و به چالش بکشند.
xAI ادعا می کند که هنگام استفاده از معیار RealWorldQA، هوش مصنوعی Grok در برابر رقبای خود مانند هوش مصنوعی GPT-4V OpenAi و هوش مصنوعی Gemini Pro 1.5 گوگل آزمایش شده است. و بهتر از رقبای خود ظاهر شود.
گفتگو در مورد این post