Tech

Kína válaszolt az OpenAI döbbenetes fejlesztésére

YouTube
YouTube

A Shengshu Technology kínai startup és a Tsinghua Egyetem hivatalosan is bemutatta Kína válaszát az OpenAI Sorájára, a Vidu-t, írja az Interesting Engineering.

A szövegből videót generálni képes mesterséges intelligencia alkalmazás a prompt megadása után egyetlen kattintással 16 másodperces klipeket tud készíteni 1080p felbontásban – ez jóval rövidebb, mint a Sora 60 másodperces videói. A fejlesztés Ázsiára összpontosít, így érti a kínai írásjeleket.

A Vidu a hírek szerint a Universal Vision Transformer (U-ViT) nevű, saját fejlesztésű vizuális transzformációs modell architektúrájára épül.

A jelentések szerint ez az architektúra valósághű videók létrehozását teszi lehetővé dinamikus kameramozgással, részletes arckifejezésekkel, valamint természetes megvilágítással és árnyékokkal.

Zhu Jun, a Shengshu vezető tudósa és a Tsinghua MI Intézetének dékánhelyettese a bemutatón elmondta, hogy bár benne volt az ütemtervükben a bemutatás, a Sora leleplezése hatalmas motivációt adott számukra.

Kapcsolódó
Tényleg kezd elmosódni a határ az emberi és gépi alkotások között
Egy új kutatás eredménye még egy éve is elképzelhetetlennek tűnt.

Ajánlott videó

Olvasói sztorik