Az OpenAI bemutatta az eddigi legfejlettebb képgenerátorát, amely Sam Altman és csapata ígéretei szerint az eddigi modellnél sokkal jobb minőségű, fotorealisztikusabb képeket tud készíteni, miközben a feliratokkal is jobban bánik. Altman szerint „ez az egyik legszórakoztatóbb és legmenőbb dolog, amit valaha is lelepleztek”, az eredményeket elnézve pedig nem túloz a techguru.

A vállalat vezetője és mérnökei a bemutató során több példát is mutattak a fejlesztés képességeire, ugyanis látszólag valós időben promptolták a modellt. Az első megoldás egyből érdekes volt, ugyanis azt kérték, mutassa meg, mi van a kamera másik oldalán a szobában a stream felvételekor. A fotón megjelenő emberek sokkal realisztikusabbak voltak, és a szöveg helyes megjelenítésével sem volt gondja a modellnek, ami nagy előrelépést jelent az eddigiekhez képest.

Ezután azt is jelezték, hogy a képgeneráláshoz saját fotókat is megadhatunk kiindulási alapként. A fejlesztők által készített szelfit így a program egy-két perc alatt egy anime-jelenetté tudta átalakítani. Altman jelezte, hogy bár eleinte még sokáig fog tartani a képek legenerálása, hamarosan ez a folyamat is felgyorsulhat.

Az új modell hamarosan minden ChatGPT felhasználónak elérhető lesz, a ChatGPT Plus, Pro, és Team ügyfeleken túl tehát a szolgáltatást ingyenesen használók is kipróbálhatják majd „a képgenerálás következő korszakát.”

Az is nagy előrelépés, hogy mivel a képgenerálás immár a GPT‑4o alapján működik, természetes kommunikációval lehet finomítani a képeken, így tulajdonképpen beszélgethetünk a chatbottal, hogy mit kell pontosan javítania.

5 fotó

Az OpenAI jelezte, hogy míg más rendszerek 5-8 objektummal küzdenek meg csak egyszerre, a GPT-4o akár 10-20 különböző objektumot is képes kezelni. A ChatGPT által generált képeken ezután sem lesz vízjel, de a fájl metaadatai tartalmazni fogják, hogy a képet az OpenAI hozta létre. A cég jelezte, hibák azonban vannak még: az MI gyakran furcsán vágja le a képeket, a hallucinálás sem tűnt el, a grafikonok és ábrák nem mindig pontosak, és nyelvkeveredés is előfordulhat.