Tech

Lehet-e kreatívabb egy robot, mint az ember?

Robin van Lonkhuijsen / ANP / AFP
Robin van Lonkhuijsen / ANP / AFP
Az utóbbi egy-két év jelentős jelentős mérföldkövet jelentett a kreatív mesterséges intelligenciák, így a kép- és zenealkotó rendszerek életében, azonban a gyors előretörés sokakat riadalommal tölt el. Így volt ezzel A kreativitás kódja szerzője, Marcus du Sautoy is, aki matematikusként szkeptikusan állt a mesterséges intelligenciák kreatív képességeihez. Seres Iván által magyarra fordított könyve azonban rámutat, közel sem olyan lehetetlen ez, mint gondoljuk.

Az adat hatalom. Az adat az új olaj.

Rengeteget halljuk napjainkban ezeket a mondatokat, és tapasztalhatjuk is, hogy a nagy információhalmazzal gazdálkodó technológia cégek valóban központi szereplőjévé váltak életünknek. Applikációkon és weboldalakon keresztül tervezzük utazásainkat, választunk szabadidős programot, itt tartjuk a kapcsolatot távol élő rokonainkkal, ismerőseinkkel, valamint a tanulás és a munka is egyre inkább ilyen platformokra helyeződik át.

Ahhoz azonban, hogy ez a 21. századi kényelem megszülethessen, és fennmaradjon, a nagy cégeknek rengeteg adatra van szükségük, amit az átlag ember sokszor utánakérdezés nélkül, tálcán nyújt át. Az emberiség adatainak mintegy 90 százaléka az elmúlt 5 évből származik, ami azt jelenti, hogy naponta 1 exabájtnyi adat (1 048 576 terabájt) jelenik meg az interneten. Ez olyan hihetetlen mennyiség, hogy ha adathordozóra akarnánk másolni, nagyjából 250 millió DVD-re lenne szükségünk. Hogy még szemléletesebb legyen a példa:

jelenleg két nap alatt állítunk elő annyi adatot, amennyi az emberiség kezdetétől 2003-ig összesen keletkezett.

De mi történik ezzel a rengeteg adattal? A cégek többsége olyan algoritmusok fejlesztésére használja az összegyűjtött információkat, amelyek nagy pontossággal meg tudják becsülni az emberi cselekvést, később pedig akár reprodukálni is képesek lesznek azt. Előbbivel már mindenkinek van élménye, aki használ közösségi médiát, vagy előfizetett egy-egy streamingszolgáltatóra. A rendszer a döntéseinket elemzi, és később ez alapján ajánl egy adott posztot, filmet vagy zeneszámot.

A képalkotó mesterséges intelligenciák előretörése és a zenei megosztókon egyre inkább feltűnő mesterséges zenészek azonban azt bizonyítják, utóbbi is belopakodott már a hétköznapjainkba. Marcus du Sautoy, az Oxfordi Egyetem matematikusprofesszora arra keresi a választ A kreativitás kódja című könyvében: lehetséges-e, hogy az ember alkotta mesterséges tudat képes lesz túlszárnyalni az embert kreativitás téren.

David Levenson / Getty Images Marcus du Sautoy

Algoritmusok a mindennapokban

A nyolcadik században élt perzsa matematikus, Abu Abdalláh Muhammad ibn Músza al-Hvárizmi után algoritmusnak elnevezett szabályrendszer kétséget kizáróan napjaink valutájává lépett elő. A hatalmas információmennyiségből dolgozó, emberi vagy még annál is fejlettebb gondolkodásra képes, gépi döntéshozatali mechanizmusok folyamatosan jelen vannak a hétköznapjainkban.

A Spotify-on az algoritmus dönt arról, melyik dal következik egy általunk kiválasztott zeneszám után, és ha azt látja, hogy elnyerte tetszésünket, az számára megerősítést jelent. A Waze útvonaltervező szolgáltatása a felhasználói visszajelzések alapján meg tudja becsülni, hol van és hol lesz dugó egy adott időszakban, amit így a sofőr ki tud kerülni. Ezzel egy időben azonban a rendszer azt is naplózza, merre járunk az autónkkal, és milyen sebességgel haladunk.

Ugyanez a helyzet a Netflix – a streamingszolgáltatók között kiugróan eredményesnek számító – algoritmusa által kreált ajánlásokkal is. Ha megnézzük például Woody Allen Annie Hall című filmjét, a rendszer egy ehhez hasonló filmet kínál számunkra következőnek. Ha ez nem nyeri el tetszésünket, az algoritmus egy pillanatra megtorpan, majd új szabályokat határoz meg, amikkel következőre nagyobb valószínűséggel ad majd pontos tippet.

Bár ezen funkciók kényelmes időtöltést biztosítanak a felhasználónak, sokszor a tudtunk nélkül adatainkkal fizetünk mindezért.

Ahhoz ugyanis, hogy a rendszer gépi tanulásra legyen képes, az adatainkban fel kell fedezni bizonyos döntési sémákat, ami idő- és információigényes munka. A technológiai cégek körében azonban egyre inkább elterjedt az a megoldás, hogy az előfizetők közreműködésével tökéletesítik algoritmusukat.

Sokaknak ismerős lehet a helyzet, amikor be akarunk lépni egy oldalra, vagy véglegesíteni egy tranzakciót, ám mielőtt ezt megtehetnénk, a rendszer elénk rak néhány képet, és arra kér minket, állapítsuk meg, melyiken látható vonat vagy jelzőlámpa. Ezzel a rendszer ellenőrzi, hogy valóban ember, és nem egy bot próbál meg véglegesíteni egy műveletet. Lényegében Turing-tesztnek vet alá minket. A művelet elvégzésével azonban tanítjuk is a rendszert, a számítógépek ugyanis továbbra sem tudják megközelíteni az emberi látó-, illetve felismerőképességet. Más területeken azonban már van, ahol előttünk járnak.

A sakkvilágbajnok legyőzésétől a verhetetlen go-algoritmusig

Joggal mondható, hogy 1997-ben elámult a világ, amikor az IBM által kifejlesztett, 20 millió dolláros számítógép, a Deep Blue egy szabályszerű hatjátszmás páros mérkőzésen New Yorkban legyőzte Garri Kaszparovot, a sakkozás akkori világbajnokát. A matematikusok számára azonban ez a diadal még nem bizonyította, hogy a gépek mennyivel komplexebb gondolkodásra képesek, mint az ember, a sakkot ugyanis kiismerhető játéknak tartották.

STAN HONDA / AFP Murray Campbell, az IBM tudósa lépést tesz az IBM Deep Blue számítógépe alapján az 1997. május 4-i, New York-i partiban Garri Kaszparov sakkvilágbajnok ellen.

2015-ban viszont Demis Hassabis és a DeepMind csapata – Elon Musk és Peter Thiel támogatásával – megalkotta az AlphaGo elnevezésű programot, amellyel a világ legrégebbi játékában, a góban akartak hasonló eredményt elérni.

De mi az a go?

A nagyjából 2500 éves kínai eredetű játékot egy 13×13-as táblán játsszák fehér és fekete kövekkel. A szakértők szerint a go jóval bonyolultabb mint a sakk, lévén a szabályos sakklépések számának leírásához 120 számjegyre van szükség, míg a go esetében ugyanehhez 300-ra. Emellett kreativitás és az intuíció is a jó gojátékos ismérve. A New York Timesban például azt írták a Deep Blue győzelme után, hogy még akár száz év is eltelhet, mire a gép legyőzi az embert góban.

Évekig tartó fejlesztés és több ezer próbajáték után elsőként a regnáló Európa-bajnokot, a kínai születésű Fan Huit hívták ki egy játszmára a program fejlesztői, az AlphaGo pedig öt-nulla arányban tönkreverte a játékost. Bár a távolkeleti sajtó a játékost okolta a vereségért, ő hónapok alatt több száz helyet lépett előre az örökranglistán, ugyanis rengeteget tanult a programtól.

Az AlphaGo csapata ezután a tizennyolcszoros dél-koreai világbajnokot, Li Szedolt hívta ki, miközben a korábbi vesztessel továbbfejlesztették a DeepMind csapat mesterséges intelligenciájának képességeit, kigyomlálva a hibákat. Egy apró meglepetést leszámítva a program nem hibázott, és végül 4:1 arányban megverte a legyőzhetetlennek tűnő világbajnokot.

Google / Getty Images Demis Hassabis és Li Szedol kezet fognak a dél-koreai világbajnok és a Google DeepMind számítógépes goprogramjának mérkőzése előtt 2016. március 9-én.

2017-ben aztán a programot visszavonultatták, az azt kifejlesztő DeepMind csapata pedig már a Google égisze alatt fejleszt beszédfelismerő és a számítógépes látást tökéletesítő szoftvereket.

Nem létező zenészek

Sokáig emberi privilégiumnak tartottuk a kreativitást, ugyanis ez az egyik legfontosabb képességünk, amely megkülönböztet minket az állatvilág fejlett példányaitól. E képességet sok minden formálja: a tapasztalatok, a felhalmozott tudás, sok esetben azonban mégis a rejtélyesen csak adottságnak nevezett, egyedi alkotási módot jelölik meg az elismert művészek fő ismérveként. Fontos azonban kiemelni, hogy a kreativitás nem korlátozódik a reál vagy a humán ismeretek oldalára: Johann Sebastian Bach esetében például tisztán látható, hogy sokszor matematikai egyenletek felhasználásával alkotta meg zenei műveit.

Ha pedig elegendő adat áll rendelkezésünkre, egy jó algoritmus segítségével könnyen reprodukálhatjuk a legkomplexebb műveket is.

Ezt bizonyítja, hogy 2021 októberében a németországi Bonnban bemutatták Beethoven X., korábban befejezetlen szimfóniájának teljes változatát. Ennek megalkotásában pedig nagy szerepet vállalt a mesterséges intelligencia is. A nemzetközi projektben az MI több mint 2 millió hangjegyet komponált a zeneszerző stílusában, majd szakértők segítségével 730 nap alatt készült el a kész művel.

Az MI által komponált szekvenciák monoton, gépies hangzását azonban élettelivé kellett varázsolni – ehhez pedig emberekre volt szükség.

A darab elkészülte után Walter Werzova osztrák zeneszerző feladata volt, hogy lelket vigyen a zenébe, többek között a tempóváltások segítségével.

Beethoven műve nem az első kreatív produktum, amit alapvetően MI hozott létre. Schubert és Mahler befejezetlen darabjainak teljes változatát, sőt Beatles-dalokat is köszönhetünk már gépeknek.

Ha pedig napjainkat nézzük, rengeteg mesterségesintelligencia-alapú zenekészítő oldal áll már a felhasználók rendelkezésére, ami kiváló választás lehet, ha egy videó aláfestéséhez választanánk muzsikát. Nem mellesleg a Spotify-on is időről időre feltűnik néhány előadó, akik az algoritmust kiismerve milliós hallgatói közönségre tesznek szert. A könyvet jegyző matematikus utána is járt néhány ilyen előadónak, azonban több esetben is kiderült, hogy nem lehet emberi alkotót társítani a projekthez, ugyanis a zene nagy valószínűséggel egy gép alkotása.

A következő Rembrandttól a képalkotó programokig

A mesterséges intelligencia által készített művészeti alkotásokkal kapcsolatosan kezdetben rengeteg ellenérzés volt az emberekben. Az első, kód által készített kép 1965-ben készült a Siemensnél dolgozó Georg Nees segítségével, aki be is mutatta művét a Stuttgarti Képzőművészeti Akadémián. Itt egyből meg is kapta a kérdést a közönségtől: eljuthat-e odáig egy számítógép, hogy utánozza azt, ahogyan én festek? Erre a szakember válasza annyi volt:

Persze, csak előbb mondja el, hogyan fest.

A kérdés rámutat, hogy a művészek alkotási folyamata sokszor nem tudatos cselekvésen alapszik. A gépek ezzel szemben szisztematikusan, pusztán adatok alapján dolgoznak, és akár arra is képesek lehetnek, hogy megszólalásig pontosan reprodukálják az emberiség legfontosabb alkotásai közt számon tartott műveket is.

Kiváló példája ennek egy, a Microsoft és a Delfti Műszaki Egyetem mérnökei által 2016-ra megalkotott, mesterséges intelligencia által előállított Rembrandt-másolat. A csoport a betanítás során összesen 346 festményt tanulmányozott, és 150 gigabájtnyi grafikát állított össze elemzés céljából. Kezdetben sima nyomatokon végeztek elemzést, azonban rájöttek, hogy a festmény nem egy kétdimenziós kép, ugyanis a festék rétegeket képez a vásznon.

Végül tizennyolc hónapnyi adatrögzítés után betáplálták az adatokat egy 3D-nyomtatóba, a Következő Rembrandtként emlegetett kép pedig már készen is állt a bemutatóra.

Ez sokakban ellenérzést váltott ki: egyrészt ijesztő volt, hogy a történelem egyik legnagyobb festőjét egy gép képes egy az egyben lemásolni, másrészt sokan azt mondták, pont a művészet lényege veszik el azzal, hogy kiveszik az alkotás mögül a történet, a szubjektum. Beszéljünk ugyanis bármilyen művészeti termékről, sokszor nem az objektív hasonlóság, hanem az egyes emberekből kiváltott érzés miatt lesz népszerű vagy épp népszerűtlen egy alkotás.

Azzal, hogy mára a mesterséges intelligencia ilyen központi szereplővé vált a mindennapjainkban, természetesen csillapodtak az emberi ellenérzések is. Sokan ugyanis rájöttek, hogy ezek célja nem az ember leváltása, csupán azok munkájának kiegészítése, esetleg támasza. Ennek köszönhető például a DALL-E és a Midjourney előretörése is, ahogy az is, hogy az utóbbi hetekben egyre többen cserélik le profilképüket egy szokványos fotó MI által megszerkesztett változatára.

Kell-e félnünk?

Az algoritmus sok szempontból jelentős hátrányban van az emberhez képest: az emberi kód évmilliók óta fejlődik, érzékszerveink pedig egyelőre gyorsabbak és kifinomultabbak, mint a gépeké. A mesterséges tudat azonban a hihetetlen mennyiségű adat miatt gyorsan fejlődik, és sok olyan dologra képes, amit kezdetben lehetetlennek tartottak:

meg lehet benne az önreflexió képessége, a kísérletezésre való hajlam, ami tökéletes alap a kreatív MI-k kifejlesztéséhez, hosszútávon pedig akár a tudatos gépek létrehozásához.

Ez persze veszélyekkel is járhat. A napjainkban tapasztalható exponenciális fejlődés láttán sokan a Skynet példáját hozzák fel, és attól félnek, a robotok túl fognak lépni az emberen. Ezt alátámasztják bizonyos kísérletek, az OpenAI laborjában ugyanis azt tapasztalták, hogy képalkotó szoftverük saját nyelvet alkotott. Így reális veszélynek tűnhet, hogy valaha megtörténik a szingularitás, nem biztos, hogy érteni fogjuk a gépek kommunikációját.

Azonban csakúgy, mint a korábban említett esetben, a rendszer addig alkotott műveinek elemzése rengeteg információval láthatja el az embert a gép gondolkodása kapcsán. Tehát minél jobban ismerünk egy adott programot, annál kevésbé vagyunk kiszolgáltatva annak.

Ajánlott videó

Olvasói sztorik