A 2022-es esztendő jelentős áttörést hozott a mesterséges intelligenciák terén, ugyanis számos, évek óta fejlesztett, gépi tanulással edzett program vált elérhetővé a nagyközönség számára. Múlt év júliusában open-beta állapotba került az OpenAI vállalat DALL-E képalkotó programja, egy fórumon keresztül pedig már a Midjourney-nek is utasításokat adhatunk, melynek eredménye egy egyedi művészeti termék lesz. Előbbi szoftvert hamarosan a Microsoft egyes programjaiban, és a Bing keresőjében is megtalálhatjuk majd.
Ennek eléréséhez évekig tartó tanulásra volt szüksége a rendszereknek, és hozzá kellett férniük az interneten fellelhető képekből készült adatbázishoz is. Az eredmény azonban eltagadhatatlan: napi több százezer laikus használja ezeket a programokat szabadidejében, sőt, egy amerikai versenyen már díjat is nyert egy MI alkotta kép – ami joggal tölti el félelemmel a képzőművészeti világ képviselőit.
Hogy jutottunk el idáig?
Az első, kód által készített kép 1965-ben látott napvilágot a Siemensnél dolgozó Georg Nees munkája nyomán. Ez a fotó még csak egyszerű geometriai formákat tartalmazott, azonban sokan már ekkor a jövő művészét látták a számítógépekben. 2016-ra pedig be is igazolódott ez a feltételezés, amikor bemutatták a Delfti Műszaki Egyetem és a Microsoft közös projektjét, mely során mesterséges intelligencia segítségével alkották újra a 17. század egyik legnagyobb hatású festőjének, Rembrandtnak az egyik művét.
A csoport a betanítás során összesen 346 festményt tanulmányozott, és 150 gigabájtnyi grafikát állított össze elemzés céljából. Kezdetben sima nyomatokon folytattak vizsgálatot, azonban idővel rájöttek, hogy a festmény nem egy kétdimenziós kép, ugyanis a festék rétegeket képez a vásznon. Végül tizennyolc hónapnyi adatrögzítés után betáplálták a 3D-nyomtatóba a paramétereket, és el is készült a Következő Rembrandtként emlegetett kép. A bemutató jelentős megrökönyödést váltott ki a közönség köreiben, mivel a festmény megszólalásig hasonlított a holland művész klasszikus művére.
Ez a projekt még szinte teljes egészében a dedikált emberi munkának volt köszönhető. Mára viszont már ott tartunk, hogy az emberiség adatbázisából, az internetről összegyűjtött adatokból önállóan képes művészeti alkotásokat létrehozni egy-egy autonóm rendszer. Jóllehet, ennek hátterében emberek által írt programkódok és a szintén emberek által feltöltött fotók állnak, a gépi tanulást alkalmazó programok képesek új műveket létrehozni, akár egy konkrét festő stílusában is. A fent említett gépi tanulási modell miatt pedig folyamatos a fejlődés: minél több lekérdezést hajtanak végre a felhasználók, a rendszer annyival pontosabb eredményeket fog adni következőre.
Mindent lehet?
Mivel a képalkotó programok fejlesztői már tanulhattak a közösségi média és a deepfake képek, illetve videók elterjedése miatt összegyűjtött tapasztalatokból, a technológiai vállalatok már beiktattak néhány szűrőt a folyamatba. Ennek eredménye például, hogy nem lehet pornográf tartalmakat készíteni ezekkel a szoftverekkel, sőt, öngyilkosságot, illetve más erőszakos tartalmakat sem hagynak jóvá az algoritmusok.
A szabályrendszerek azonban gyártótól és programtól függően jelentősen eltérnek. A DALL-E rendszere például megtagadja a politikusok nevével, drogokkal, vulgáris szavakkal és bizonyos betegségekkel kapcsolatos szövegek képpé történő átformálását. Erről egy rendkívül részletes tájékoztató is megjelenik a felhasználónak minden egyes lekérdezés véglegesítése előtt.
A programok alapját egy chatbot képezi, ami a Midjourney esetében a Discordon keresztül érhető el. Itt az /imagine parancs bepötyögése után generálhatunk képeket szöveges formátum betáplálásával, míg a DALL-E esetében különálló weboldal és telefonos applikáció is a rendelkezésünkre áll. Az OpenAI programja a saját, meglepően eredményes chatbotjának egy dedikáltan képekre létrehozott változatát használja a parancsok lefuttatására.
Mivel a közösségi médiában is hatalmas elérésre tettek szert a programok által kreált képek, folyamatosan a felhasználói bázis. Számokban ez azt jelenti, hogy a Midjourney-t naponta nagyjából félmillió ember használja, a DALL-E-t pedig mintegy másfél millió – a két programmal együttesen pedig több mint két-hárommillió mesterséges fotót generálnak 24 óra leforgása alatt.
Veszélyben a szerzői és a személyiségi jogok
A technológiai innováció életünk számos aspektusát megkönnyíti, azonban időről időre felmerül a kérdés, hogy kell-e tartanunk bizonyos fejlesztésektől. Hiszen az okostelefonunkon keresztül lehallgathat a kormányunk, a kereséseink alapján pedig célzott reklámokkal tudnak bombázni egyes nagyvállalatok. Ezekhez hasonlóan a képalkotó mesterséges intelligenciák is tartogatnak veszélyeket: míg a deepfake és a pornográf tartalmakat tiltják, valódi művészek valódi alkotásait simán használják a program tanításához.
A szellemi tulajdonhoz való jog alapvetően is komplex kérdéskörnek mondható, a mesterséges intelligencia képbe kerülése pedig csak még jobban megbonyolítja a helyzetet. A gépek által kreált alkotásokon ugyanis sok esetben nem azonosíthatók be az eredeti művészi alkotások nyomai, inkább csak annak hatásai, amit bizonyítani nem egyszerű. A beazonosítást azonban megkönnyítheti a mesterséges intelligencia által gyakran használt fantom aláírások – az inspirációt jelentő művészek képein található szignók MI által megváltoztatott formái,
Az elmúlt hónapokban számos művész nyilvánította ki ellenérzését a mesterséges intelligencia által kreált képek használata kapcsán mielőbbi szabályozást követelve a jogalkotóktól. Céljaik között azt fogalmazták meg, hogy különböztessék meg az MI képeket az emberi alkotásoktól, valamint hogy korlátozzák a fejlesztőket oly módon, hogy csak azon művészek munkáit használhassák fel a program tanításához, aki ebbe beleegyezett. Emellett természetesen a mesterséges intelligenciával kapcsolatos edukáció fontosságát is hangsúlyozták.
A tiltakozást követően pedig néhány napja az egyik legnagyobb fotóügynökség, a Getty Images bejelentette: pert indít szerzői jogok megsértése miatt a Stability AI ellen, amely a népszerű Stable Diffusion képalkotó MI mögött áll. A cég azt állítja, hogy a mesterséges intelligencia alapú programot üzemeltető vállalat jogtalanul másolt és dolgozott fel több millió szerzői jogvédelem alatt álló képet a szoftvere betanításához, ráadásul ellenszolgáltatás nélkül használta ezeket profitszerzésre.
A szerzői jogok mellett természetesen személyiségi jogi kérdések is felmerülhetnek, lévén a programok nyilvánosan elérhető adatokból dolgoznak, ám ezt a területet a szabályozó szervek és maguk a fejlesztők is komolyabban veszik. Nem véletlen, hogyha saját képet töltünk fel, a DALL-E külön figyelmeztet, hogy másokról készült képeket csak az adott személy beleegyezésével töltsünk fel. Igaz, ez önmagában még nem rettenti el a rosszakarókat.
Vannak azonban olyan programok is, amelyek kapcsán az aggályok nem csupán a rendszer jellegéből, hanem a mesterséges intelligenciát hívószóként használó fejlesztőcég hátteréből is adódnak. Így van ez az utóbbi hónapok egyik legnépszerűbb alkalmazásával, a Lensa AI appal is. Hubert Csaba etikus hacker arra figyelmeztet, hogy az app mögött álló Prisma Labs vállalat erősen kötődik az orosz Szövetségi Biztonsági Szolgálathoz, vagyis az FSZB-hez.
A cég alapítója, Alexey Moiseenkov 2016-tól egy titkos csapatot vezetett a mail.ru e-mail szolgáltatónál, egy másik társalapító, Andrey Usoltsev pedig korábban 6 évet dolgozott a Yandex orosz technológiai óriásnál, amely köztudottan szoros kapcsolatban áll az orosz nemzetbiztonsági szolgálatokkal. A fejlesztők adatai között – vélhetően megtévesztés céljából – azonban egy egyesült államokbeli cím van megadva a cég központjaként. Aggályt jelent továbbá az is, hogy az alkalmazás tárolhatja a feltöltött képek metaadatait, a felhasználó IP-címét, illetve a telefonja adatait, amelyeket később amerikai és ciprusi szerverekre továbbíthatnak.