A Shengshu Technology kínai startup és a Tsinghua Egyetem hivatalosan is bemutatta Kína válaszát az OpenAI Sorájára, a Vidu-t, írja az Interesting Engineering.
A szövegből videót generálni képes mesterséges intelligencia alkalmazás a prompt megadása után egyetlen kattintással 16 másodperces klipeket tud készíteni 1080p felbontásban – ez jóval rövidebb, mint a Sora 60 másodperces videói. A fejlesztés Ázsiára összpontosít, így érti a kínai írásjeleket.
A jelentések szerint ez az architektúra valósághű videók létrehozását teszi lehetővé dinamikus kameramozgással, részletes arckifejezésekkel, valamint természetes megvilágítással és árnyékokkal.
Zhu Jun, a Shengshu vezető tudósa és a Tsinghua MI Intézetének dékánhelyettese a bemutatón elmondta, hogy bár benne volt az ütemtervükben a bemutatás, a Sora leleplezése hatalmas motivációt adott számukra.