Tech

Saját mesterséges intelligenciára van szüksége Európának

Getty Images
Getty Images
Bombaként robbant március végén a hír, hogy Olaszország betiltja a ChatGPT használatát. A bejelentés után több európai ország is jelezte, vizsgálatot indít az OpenAI adatkezelése miatt, miközben az Európai Unió már a mesterséges intelligencia átfogó szabályozásán dolgozik. Dr. Rab Árpád Szörény jövőkutató szerint azonban nem lehet a végtelenségig szabályozni, Európának inkább saját MI-re van szüksége.

Nem túlzás azt mondani, hogy a ChatGPT novemberi elindulása teljesen feje tetejére állította a világot. A Microsoft által is erősen támogatott OpenAI fejlesztése amellett, hogy jó szórakozást és még jobb osztályzatokat biztosít a fiataloknak az iskolapadban, teljesen új korszakot nyitott a Google által dominált keresőpiacon. A chatbot eddig elképzelhetetlen munkaerőpiaci trendeknek nyitott ajtót, melyek révén az értelmiségi szakmákat végző emberekre is sikerült ráijeszteni, a visszaélések miatt pedig a törvényhozók körében is riadalmat keltett, nem éppen érdemtelenül.

A technológiával kapcsolatos aggályok nem csak a laikusok körében szaporodtak meg, hanem bizony a számítógépes tudományok úttörőinek kollektív tudatában is. Március végén több elismert szakember is arra kérte a tech cégeket, hogy legalább hat hónapra függesszék fel a mesterséges intelligenciával kapcsolatos kísérleteiket. A kezdeményezést Elon Musk, a SpaceX, a Tesla és a Twitter vezérigazgatója, Steve Wozniak, az Apple társalapítója és Yuval Noah Harari történész és több ezer további ember támogatta.

Sam Altman, az OpenAI vezetője azonban nem fogadta meg a szakemberek kérését, és egyes hírek szerint akár már az idei év végén bemutatkozhat a GPT-5 nyelvi modell, ami már elérheti a mesterséges általános intelligencia (AGI) szintjét. Ez már az MI-k egy magasabb szintje, ahol a robot képes megérteni és megtanulni minden olyan feladatot, amire az ember képes. A fejlesztők körében azonban sokkal jelentősebb riadalomra okozott, hogy Olaszország egy csapásra betiltotta a ChatGPT-t.

Mi történt?

Március utolsó napján robbant a hír, hogy Olaszország azonnali hatállyal megtiltotta a hozzáférést az OpenAI által fejlesztett ChatGPT chatbothoz. Az olasz Nemzeti Adatvédelmi Hatóság (Garante) közleményében az EU általános adatvédelmi rendeletének (GDPR) állítólagos megsértésére hivatkozott, valamint egy március 20-ai adatvédelmi incidenst jelölt meg problémaként, mely során a felhasználók beszélgetései és a fizetős szolgáltatás előfizetőinek személyes adatai is kiszivároghattak.

A hatóság továbbá nehezményezte, hogy 13 év alatti fiatalok is hozzáférhettek az oldalhoz, szülői jóváhagyás nélkül. Ezzel a lépéssel Olaszország olyan országok közösséghez csatlakozott, amelyek betiltották a platform elérését.

A nem túl baráti felsorolásban olyan államok kapnak helyet, mint Kína, Észak-Korea, Oroszország, Kuba, Szíria vagy éppen Irán, amelyekben szinte egytől egyig a rezsim szélsőséges ideológiai nézetei miatt volt szükség a tiltásra.

Az olaszok példáján felbuzdulva több európai ország is elgondolkodott a korlátozáson. Franciaországban Jean-Noël Barrot digitális miniszter kijelentette: az oldal láthatóan nem tiszteli a GDPR-irányelveket, azonban a megoldás nem a tiltásban van, hanem az új technológiák kijavításában és az ahhoz szükséges kompetenciák elsajátításában. A német adatvédelmi biztos, Ulrich Kelber szerint elvileg Németországban is lehetséges egy ilyen lépés, mivel egy ilyen határozat állami jogkörbe tartozik. A szakember elárulta, Írország adatvédelmi szakembereivel egyetemben további információt kértek Olaszországtól a tilalom részleteivel kapcsolatosan.

Thomas Trutschel / Photothek / dpa Picture-Alliance / AFP

Kemény követelései vannak az olaszoknak

Pár héttel a tiltás bejelentése után, április 12-én a Garante aztán közzé is tette, milyen lépéseket vár az OpenAI-tól annak érdekében, hogy megszüntessék a tiltást. A hatóság közölte, a vállalatnak közzé kell tennie egy tájékoztatót az oldalán, amelyben leírják a ChatGPT működéséhez szükséges adatkezelési szabályokat, valamint az érintettek jogait. A fejlesztőnek ezt meg kell mutatnia az olasz felhasználóknak, akiknek a regisztráció befejezése előtt nyilatkozniuk kell arról, hogy elmúltak 18 évesek.

Itt azonban még közel sincs vége a követeléseknek. A Garante ugyanis arra kényszerítené az OpenAI-t, hogy szeptember végéig lássa el korhatárkapuval az oldalát, hogy kiszűrje a 13 év alatti felhasználókat, továbbá szülői engedélyhez kötné a 13 és 18 év közötti felhasználóknak a belépést. Ezen felül ki kell fejleszteniük egy olyan eszközt is, amellyel a felhasználók jelezhetik, nem kívánják az adataikat a nyelvi modell képzéséhez átadni.

Végül május 31-ig az olasz rádiókban, televíziókban és újságokban, valamint az interneten tájékoztató reklámkampányt kell indítaniuk.

Ezek részeként tájékoztatniuk kell a nyilvánosságot az adatgyűjtésük módszereiről és arról, hogy az olaszok személyes adatait hogyan használják fel a vállalat algoritmusainak képzésére. Az olasz felügyeleti hatóság ismét nyomatékosította, hogy amennyiben a ChatGPT mögött álló vállalat nem orvosolja hamar az adatvédelmi problémákat, 20 millió euró vagy az éves bevétel 4 százalékának megfelelő bírság kiszabására számíthat.

A feltételek nehezen tűnnek megugorhatónak, főleg ilyen rövid határidőkkel, azonban az OpenAI szóvivője pozitívan értékelte a döntést a Reutersnek.

Örülünk, hogy az olasz Garante átgondolja a döntését, és már várjuk az együttműködés kezdetét, ahogy azt is, hogy a ChatGPT hamarosan újra elérhetővé váljon ügyfeleink számára Olaszországban.

Túlszabályoz az Európai Unió?

Az Európai Unióban évek óta azt lehet tapasztalni, hogy a mesterséges intelligenciához hasonló robosztus rendszerek fejlesztésében sokkal előrébb jár az Egyesült Államok és Kína, így az öreg kontinensnek leginkább csak a szabályozás marad. Az EU jelenleg is nagy erőkkel dolgozik a mesterséges intelligencia szabályozását célzó, AI Act elnevezésű dokumentumon, amelynek első változata még idén, várhatóan novemberben jelenik meg. Az átfogó szabályozás mellett pedig a ChatGPT-nek is külön figyelmet szentelnek Európában.

Az európai adatvédelmi hatóságokat tömörítő Európai Adatvédelmi Testület (EDPB) április 14-én ugyanis bejelentette: külön munkacsoportot állítanak fel, ami a ChatGPT által jelentette adatvédelmi kockázatokat vizsgálja. A tájékoztatás szerint a munkacsoportot azért hozták létre, hogy elősegítsék az együttműködést az adatvédelmi hatóságok által végrehajtott lehetséges végrehajtási intézkedésekkel kapcsolatos információcserében.

Dr. Rab Árpád Szörény, a Nemzeti Közszolgálati Egyetem Információs Társadalom Kutatóintézetének tudományos főmunkatársa szerint informatikai szabályozás területén alapvetően három modell létezik jelenleg a világon: a kínai, az amerikai és az európai.

Kínában hatalmas mesterségesintelligencia-rendszerek működnek, amelyeket sokszor megfigyelési céllal használnak. Itt az állampárt nem csinál ügyet a személyiségi jogi kérdésekből, könnyedén begyűjthetők a felhasználói adatok profilozási célból. Az Egyesült Államokban nem a politikai, sokkal inkább az üzleti célok érvényesülnek: az embereknek adottak a jogai, azonban amint elfogadnak egy üzleti szabályozást, lényegében lemondanak azokról.

Az Európai Unió ezzel szemben sokkal nagyobb hangsúlyt fektet az adatvédelemre, ami viszont komoly gazdasági hátrányt jelent. Egy jól működő MI-nek ugyanis rengeteg adatra van szüksége.

Szerencsére azt már az Európai Unióban is felismerték, hogy egyensúlyt kell találni az adatok felszabadítása és az adatok védelme között. A most megjelenő európai adatstratégia például már azt mondja ki, hogy szükség van olyan nagy európai adatterekre, ahonnan adatokat lehet kinyerni. Itt azonban vékony a határmezsgye: nehéz ugyanis úgy hozzáférhetővé tenni az adatokat, hogy garantálva legyen a személyiségi jogok védelme és az adatok anonimizálása is.

A jövőkutató lapunknak elmondta, az MI és a profilozás korában már vissza lehet fejteni az anonim adatokat is (deanonimizálás), éppen ezért hatalmas problémát jelent, hogy nem tudjuk, mit kezd az adatokkal az amerikai OpenAI.

A nagy adattömegekre alapozott, azok alapján generált új adatok tulajdona, kezelése, és felhasználásának szabályozása mellett a visszafelé vezető út is problémás: az anonimizált adatokra alapozott célcsoport profilozás létező lehetőségét kezelni kell.

Mohos Márton / 24.hu Dr. Rab Árpád Szörény

Megoldás: európai mesterséges intelligencia

A mesterséges intelligencia fejlődésének sebessége sokakat meglepett, pedig a kutatók már jó ideje előre jelezték, hogy erre lehet számítani. A problémát pedig csak felnagyította, hogy hiányzott a prevenció: a szakmai szervezetek nem kommunikálták előzetesen, miként érdemes hozzányúlni a chatbotokhoz. Ebben természetesen nagy szerepe volt annak, hogy robbanásszerű volt azok terjedése: a ChatGPT pár hét alatt a leggyorsabban növekvő internetes szolgáltatássá lépett elő, lepipálva a Facebookot és a TikTokot.

Ennek hatására az emberek szinte rögtön olyan személyes adatokat kezdtek el betáplálni a rendszerbe, mint az egészségügyi információik, vagy épp a céges levelezésük. Az pedig, hogy a tengerentúli anyacég, az OpenAI nem közli, miként kezeli az adatokat, és többek közt európai állampolgárok adatai által tesz szert jelentős mennyiségű profitra, már csak olaj volt a tűzre. A lapunknak megszólaló szakember szerint ezek tükrében nem kérdés, hogy az MI-t szabályozni kell: a szakértők után várhatóan az Európai Unió is azt kéri majd a cégektől, hogy fél évig szüneteltessék a fejlesztést.

Rab Árpád szerint ez, és a szabályozás viszont nem oldja meg önmagában az Európai Unió lemaradását, és nem kérdés, hogy az öreg kontinensnek is saját fejlesztésekre lesz szüksége. Az NKE Információs Társadalom Kutatóintézetének tudományos főmunkatársa szerint azonban ha nem szabadítjuk fel az adatokat, sosem lesz jó mesterséges intelligencia az Európai Unióban. Ehhez viszont elmondása szerint komoly átalakításra lesz szükség, ugyanis 10 éve ugyanazokkal a szabályozásokkal próbálkoznak.

A korhatáros bejelölést simán át lehet hágni, személyi igazolványt pedig nem kérhetnek el a weboldalak a GDPR miatt. Így tehát egyértelmű, hogy a cégek felelősségét kell növelni. Az európai MI létrehozása szükségszerű, ugyanis ha az EU-s állampolgárok adataiból táplálkozó programok más országokban termelnek hasznot, az hatalmas gazdasági kiesést jelent.

A szakember szerint a megszokott szabályok alkalmazása a társadalmi bizalom elérésében segít már csak, ahhoz hogy Európa versenyképes maradjon, és megszűnjék a gazdasági vákuum, egyértelműen saját fejlesztésekre van szükség. A jövőkutató szerint pedig már látni is a lépéseket ebbe az irányba: Spanyolországban például már létrehoztak egy programot, ami a mesterségesintelligencia-fókuszú startupokat segíti, és már fejlett magyar nyelvi modellel is büszkélkedhetünk.

Áttörés a magyar nyelvi mesterségesintelligencia-kutatásban

2022 novemberében az Eötvös Lóránd Kutatási Hálózat Nyelvtudományi Kutatóközpontja (NYTK) bejelentette, hogy kutatói két, világszínvonalon is jelentős nyelvmodellt fejlesztettek ki szuperszámítógépeken, neurális technológiát használó gépi tanulási algoritmusok segítségével. A magyar nyelvre elkészült első GPT-3 típusú mesterséges intelligencia, a HILANCO-GPTX a Nyelvtudományi Kutatóközpont és a Pécsi Tudományegyetem közös fejlesztéseként született meg.

 

Az angol és magyar nyelven egyaránt folyékony kommunikációra és szövegelőállításra is alkalmas rendszerről ekkor azt kommunikálták, hogy akár még programkódot is képes generálni. A kétnyelvű rendszer betanításához a fejlesztők egy 102 milliárd szavas angol és egy 25 milliárd szavas magyar szövegkorpuszt használtak fel. A három hónapon át tartó gépi tanulás eredményeképpen létrejött nyelvi mesterséges intelligencia mindkét nyelven jól szerkesztett mondatokat képes alkotni, sőt akár még fordítani is tud a két nyelv között.

 

A Nyelvtudományi Kutatóközpont munkatársai a fenti technológiát és szuperszámítógép-rendszert használva elkészítettek egy az előzőnél is nagyobb magyar nyelvű anyagon tanított nyelvmodellt, a PULI GPT-3SX-et. Ez egy 32 milliárd szóból álló, csak magyar nyelvű szövegeket tartalmazó anyagon tanult magyarul. Nonprofit kutatás-fejlesztési célokra egyébként mindkét nyelvmodell ingyenesen elérhető.

A kutató jelezte, a szabályozás nagy valószínűséggel nem lesz elegendő, ugyanis egy évtized sem volt elég arra, hogy a közösségi médiaszolgáltatók lehetőségeit egy megnyugtató módon működő keretrendszerben összefoglalják az EU-ban.

„Most is hasonló kihívással állunk szemben, csak éppen nagyobb, okosabb, kevésbé átlátható helyzetben” — mondta a jövőkutató. A technológiai szabályozás mellett Rab Árpád szerint fontos az üzleti szereplők felelősségének szabályozása, és az emberek digitális tudatosságának növelése. Végül pedig az is, hogy visszaszerezze Európa az üzleti lépéselőnyt a nem európai cégek elől. A kutató ugyanakkor bízik abban, hogy a közösségi appok és a streamingek térhódítása után sikerült megtanulni a leckét, és képes lesz az Európai Unió is előállni egy versenyképes alternatívával.

Ajánlott videó

Olvasói sztorik