Az OpenAI hétfőn bemutatta legújabb frissítését, a GPT-4 Omni-t, ami hamarosan az ingyenes felhasználók számára is elérhető lesz. Mira Murati technológiai igazgató szerint a fejlesztés GPT-4 szintű intelligenciát biztosít, de sokkal gyorsabb lesz, írja a Gizmodo.
A GPT-4o fejlesztés egyik legfőbb újítása, hogy már a verbális felszólításokra is reagál, így akár szóban is beszélgethetünk vele. Érdekesség, hogy a női hangon megszólaló asszisztensnek érzelmi intonációja is van, néha izgatottságot mutat, máskor pedig nevetni is tud. Ezenkívül képes azonosítani az érzelmeket és a hangot a felhasználók beszédében is.
Míg a ChatGPT korábban csak külön tudott feldolgozni szöveget, képet és hangot, addig a GPT-4o egy olyan modell, amely képes mindhárom feldolgozására. Így minden sokkal gyorsabban működik. Így például ha egy matekfeladat megoldását befotózzuk, szóban le tudja vezetni, hogy kell megoldani.
A demót követően az OpenAI kiadja a GPT-4o-t asztali alkalmazásként a macOS rendszerhez. Ezt már ma megkapják a fizetős felhasználók, de a jövőben a GPT-4o elérhető lesz az ingyenes felhasználók számára is. Az asztali alkalmazás egyébként lehetővé teszi, hogy közvetlenül a számítógépéről indítson beszélgetést a ChatGPT-vel, és a képernyőmegosztást is támogatja. Emellett a ChatGPT webhelyét is frissítették a könnyebb átláthatóságért.
Az OpenAI munkatársai, Mark Chen és Barret Zoph többféle élethelyzetben is bemutatták a fejlesztést: A GPT-4o lefekvés előtti meséket mesélt, matematikai problémák megoldásában segített, és bár volt néhány alkalom, amikor nem értette meg a felhasználókat, összességében óriási előrelépésnek tűnik az Omni. Az OpenAI egyik munkatársa szerint a legújabb chatbot több mutatóban is felülmúlta a versenytársait, beleértve a piacvezető GPT-4 Turbót és a Claude 3 Opust is.