OPENAI / AFP
Tech

Művészek és felhasználók is okkal tarthatnak az intelligens képalkotó programoktól

Néhány éve még csak disztópikus filmekben találkozhattunk működő mesterséges intelligenciákkal, napjainkra viszont elértünk oda, hogy zene, szöveg és kép alkotására is képesek bizonyos gépi tanulással edzett szoftverek. Amennyire elismerésre méltó azonban a fejlesztők eredménye, legalább annyi veszélyt is rejt a terület.

A 2022-es esztendő jelentős áttörést hozott a mesterséges intelligenciák terén, ugyanis számos, évek óta fejlesztett, gépi tanulással edzett program vált elérhetővé a nagyközönség számára. Múlt év júliusában open-beta állapotba került az OpenAI vállalat DALL-E képalkotó programja, egy fórumon keresztül pedig már a Midjourney-nek is utasításokat adhatunk, melynek eredménye egy egyedi művészeti termék lesz. Előbbi szoftvert hamarosan a Microsoft egyes programjaiban, és a Bing keresőjében is megtalálhatjuk majd.

A neurális hálók egy komplex lekérdezést lefuttatva, néhány szó megadásával képes elkészíteni egy képet az interneten fellelhető tartalmak felhasználásával.

Ennek eléréséhez évekig tartó tanulásra volt szüksége a rendszereknek, és hozzá kellett férniük az interneten fellelhető képekből készült adatbázishoz is. Az eredmény azonban eltagadhatatlan: napi több százezer laikus használja ezeket a programokat szabadidejében, sőt, egy amerikai versenyen már díjat is nyert egy MI alkotta kép – ami joggal tölti el félelemmel a képzőművészeti világ képviselőit.

OpenAI / AFP Az OpenAI mesterséges intelligenciájával készült kép.

Hogy jutottunk el idáig?

Az első, kód által készített kép 1965-ben látott napvilágot a Siemensnél dolgozó Georg Nees munkája nyomán. Ez a fotó még csak egyszerű geometriai formákat tartalmazott, azonban sokan már ekkor a jövő művészét látták a számítógépekben. 2016-ra pedig be is igazolódott ez a feltételezés, amikor bemutatták a Delfti Műszaki Egyetem és a Microsoft közös projektjét, mely során mesterséges intelligencia segítségével alkották újra a 17. század egyik legnagyobb hatású festőjének, Rembrandtnak az egyik művét.

A csoport a betanítás során összesen 346 festményt tanulmányozott, és 150 gigabájtnyi grafikát állított össze elemzés céljából. Kezdetben sima nyomatokon folytattak vizsgálatot, azonban idővel rájöttek, hogy a festmény nem egy kétdimenziós kép, ugyanis a festék rétegeket képez a vásznon. Végül tizennyolc hónapnyi adatrögzítés után betáplálták a 3D-nyomtatóba a paramétereket, és el is készült a Következő Rembrandtként emlegetett kép. A bemutató jelentős megrökönyödést váltott ki a közönség köreiben, mivel a festmény megszólalásig hasonlított a holland művész klasszikus művére.

Ez a projekt még szinte teljes egészében a dedikált emberi munkának volt köszönhető. Mára viszont már ott tartunk, hogy az emberiség adatbázisából, az internetről összegyűjtött adatokból önállóan képes művészeti alkotásokat létrehozni egy-egy autonóm rendszer. Jóllehet, ennek hátterében emberek által írt programkódok és a szintén emberek által feltöltött fotók állnak, a gépi tanulást alkalmazó programok képesek új műveket létrehozni, akár egy konkrét festő stílusában is. A fent említett gépi tanulási modell miatt pedig folyamatos a fejlődés: minél több lekérdezést hajtanak végre a felhasználók, a rendszer annyival pontosabb eredményeket fog adni következőre.

ROBIN VAN LONKHUIJSEN / ANP MAG / ANP / AFP Rembrandt 346 festményének tanulmányozása alapján létrejött alkotás.

Mindent lehet?

Mivel a képalkotó programok fejlesztői már tanulhattak a közösségi média és a deepfake képek, illetve videók elterjedése miatt összegyűjtött tapasztalatokból, a technológiai vállalatok már beiktattak néhány szűrőt a folyamatba. Ennek eredménye például, hogy nem lehet pornográf tartalmakat készíteni ezekkel a szoftverekkel, sőt, öngyilkosságot, illetve más erőszakos tartalmakat sem hagynak jóvá az algoritmusok.

A szabályrendszerek azonban gyártótól és programtól függően jelentősen eltérnek. A DALL-E rendszere például megtagadja a politikusok nevével, drogokkal, vulgáris szavakkal és bizonyos betegségekkel kapcsolatos szövegek képpé történő átformálását. Erről egy rendkívül részletes tájékoztató is megjelenik a felhasználónak minden egyes lekérdezés véglegesítése előtt.

A Midjourney ebben a tekintetben jóval megengedőbb, és főleg felnőtt, erőszakos vagy másokat megbotránkoztató tartalmakat utasít el, politikusokkal kapcsolatos tartalmakat azonban simán generálhatunk, akár Orbán Viktorról és Vlagyimir Putyinról is.

A programok alapját egy chatbot képezi, ami a Midjourney esetében a Discordon keresztül érhető el. Itt az /imagine parancs bepötyögése után generálhatunk képeket szöveges formátum betáplálásával, míg a DALL-E esetében különálló weboldal és telefonos applikáció is a rendelkezésünkre áll. Az OpenAI programja a saját, meglepően eredményes chatbotjának egy dedikáltan képekre létrehozott változatát használja a parancsok lefuttatására.

Mivel a közösségi médiában is hatalmas elérésre tettek szert a programok által kreált képek, folyamatosan a felhasználói bázis. Számokban ez azt jelenti, hogy a Midjourney-t naponta nagyjából félmillió ember használja, a DALL-E-t pedig mintegy másfél millió – a két programmal együttesen pedig több mint két-hárommillió mesterséges fotót generálnak 24 óra leforgása alatt.

Veszélyben a szerzői és a személyiségi jogok

A technológiai innováció életünk számos aspektusát megkönnyíti, azonban időről időre felmerül a kérdés, hogy kell-e tartanunk bizonyos fejlesztésektől. Hiszen az okostelefonunkon keresztül lehallgathat a kormányunk, a kereséseink alapján pedig célzott reklámokkal tudnak bombázni egyes nagyvállalatok. Ezekhez hasonlóan a képalkotó mesterséges intelligenciák is tartogatnak veszélyeket: míg a deepfake és a pornográf tartalmakat tiltják, valódi művészek valódi alkotásait simán használják a program tanításához.

A szellemi tulajdonhoz való jog alapvetően is komplex kérdéskörnek mondható, a mesterséges intelligencia képbe kerülése pedig csak még jobban megbonyolítja a helyzetet. A gépek által kreált alkotásokon ugyanis sok esetben nem azonosíthatók be az eredeti művészi alkotások nyomai, inkább csak annak hatásai, amit bizonyítani nem egyszerű. A beazonosítást azonban megkönnyítheti a mesterséges intelligencia által gyakran használt fantom aláírások – az inspirációt jelentő művészek képein található szignók MI által megváltoztatott formái,

A hézagokkal teli, kevéssé szabályozott területen az MI azért okoz problémát, mert nem lehet azt mondani, hogy egy ember tudatos döntése alapján, profitszerzési céllal vett át egy terméket egy másik alkotótól.

OPENAI / AFP DALL-E képgeneráló programmal készült kép.

Az elmúlt hónapokban számos művész nyilvánította ki ellenérzését a mesterséges intelligencia által kreált képek használata kapcsán mielőbbi szabályozást követelve a jogalkotóktól. Céljaik között azt fogalmazták meg, hogy különböztessék meg az MI képeket az emberi alkotásoktól, valamint hogy korlátozzák a fejlesztőket oly módon, hogy csak azon művészek munkáit használhassák fel a program tanításához, aki ebbe beleegyezett. Emellett természetesen a mesterséges intelligenciával kapcsolatos edukáció fontosságát is hangsúlyozták.

A tiltakozást követően pedig néhány napja az egyik legnagyobb fotóügynökség, a Getty Images bejelentette: pert indít szerzői jogok megsértése miatt a Stability AI ellen, amely a népszerű Stable Diffusion képalkotó MI mögött áll. A cég azt állítja, hogy a mesterséges intelligencia alapú programot üzemeltető vállalat jogtalanul másolt és dolgozott fel több millió szerzői jogvédelem alatt álló képet a szoftvere betanításához, ráadásul ellenszolgáltatás nélkül használta ezeket profitszerzésre.

A brit bíróságon benyújtott kereset eredménye könnyen lehet, hogy precedens értékű lesz.

A szerzői jogok mellett természetesen személyiségi jogi kérdések is felmerülhetnek, lévén a programok nyilvánosan elérhető adatokból dolgoznak, ám ezt a területet a szabályozó szervek és maguk a fejlesztők is komolyabban veszik. Nem véletlen, hogyha saját képet töltünk fel, a DALL-E külön figyelmeztet, hogy másokról készült képeket csak az adott személy beleegyezésével töltsünk fel. Igaz, ez önmagában még nem rettenti el a rosszakarókat.

Vannak azonban olyan programok is, amelyek kapcsán az aggályok nem csupán a rendszer jellegéből, hanem a mesterséges intelligenciát hívószóként használó fejlesztőcég hátteréből is adódnak. Így van ez az utóbbi hónapok egyik legnépszerűbb alkalmazásával, a Lensa AI appal is. Hubert Csaba etikus hacker arra figyelmeztet, hogy az app mögött álló Prisma Labs vállalat erősen kötődik az orosz Szövetségi Biztonsági Szolgálathoz, vagyis az FSZB-hez.

A cég alapítója, Alexey Moiseenkov 2016-tól egy titkos csapatot vezetett a mail.ru e-mail szolgáltatónál, egy másik társalapító, Andrey Usoltsev pedig korábban 6 évet dolgozott a Yandex orosz technológiai óriásnál, amely köztudottan szoros kapcsolatban áll az orosz nemzetbiztonsági szolgálatokkal. A fejlesztők adatai között – vélhetően megtévesztés céljából – azonban egy egyesült államokbeli cím van megadva a cég központjaként. Aggályt jelent továbbá az is, hogy az alkalmazás tárolhatja a feltöltött képek metaadatait, a felhasználó IP-címét, illetve a telefonja adatait, amelyeket később amerikai és ciprusi szerverekre továbbíthatnak.

Ajánlott videó