Az algoritmusok meghatározzák az életünket – de jó ez nekünk?

Alessandro Vespignani

Olasz származású fizikus, kutatási területe a komplex rendszerek, a hálózatelmélet és a számítástudomány. A bostoni Northeastern University Hálózattudományi Intézetének igazgatója. Tagja az Amerikai Fizikai Társaságnak, a Harvardon működő Kvantitatív Társadalomtudományi Intézetnek, valamint a londoni székhelyű Academia Europaeának. A tudományos előrejelzés és a hálózatelmélet területén napjaink legelismertebb tudósai között jegyzik, Barabási Albert-László közeli munkatársa.

Sokszor halljuk azt a kifejezést, hogy hálózatelmélet, de nem könnyű pontosan meghatározni a fogalmat. El tudja röviden magyarázni a jelentését?

A világot hálózatok alkotják, azok kötnek össze mindent, amit látunk. Ha a társadalomra gondolunk, közlekedési, mobil-, áruelosztási és kereskedelmi hálózatokba ágyazódva éljük az életünket. Minden hálózat. És ott vannak a társadalmi kapcsolatok, a közösségi médiát konkrétan hálózatként találták ki, ott vagyunk a Twitteren és a Facebookon, ott lépünk kapcsolatba a saját hálózatunkat alkotó emberekkel. Ha megértjük a hálózatokat, megértjük a világot is. A hálózatok ott vannak a testünkben is, az agyunk maga egy hálózat, és a sejtjeink is ilyen formában léteznek, vagyis a betegségek megértéséhez is egy hálózatot kell megértenünk. Végül, ha arra gondolunk, ami most éppen történik világszerte, a betegségek szintén hálózatokon keresztül terjednek, mert így tudnak eljutni egyik emberből a másikba. Az utóbbi három hónapban nem csináltunk mást, mint megpróbáltunk tönkretenni egy hálózatot, hogy így vessünk véget egy járványnak: maradj otthon, ne találkozz senkivel! A könyv a hálózatok forradalmától indul, és bemutatja azt, hogyan jutottunk el algoritmusok és számítógépek segítségével oda, hogy előre tudjuk jelezni a jövőt, akár az egyénekre vonatkoztatva is.

A könyvében a modern hálózatelmélet fontos elemeként tünteti fel a nagy mennyiségben rendelkezésre álló adatokat, vagyis a big datát, valamint az úgynevezett datifikációt. Miért ilyen lényeges ez, és hogyan használható a hálózatkutatás során?

Ha húsz évvel ezelőtt azt mondtam volna, hogy a betegségek hálózatokon keresztül terjednek, be tudjuk mérni ezt a hálózatot? Azt a választ kaptam volna, hogy nem, hogyan is tudnánk ezt megtenni?! Akkor megfigyeléseket végeztünk, kérdőíveket készítettünk, most meg a mobilszolgáltatók segítségével meg tudom nézni, ki hol volt és mit csinált egy adott pillanatban, sőt a Twitteren és a Facebookon azt is látom, hogy ki mit írt. Ezek az adatok kulcsfontosságúak ahhoz, hogy az elmélettől eljussunk az alkalmazásig, hogy képesek legyünk előrejelzéseket és elemzéseket készíteni. Olyan ez, mint az időjárás-előrejelzés: hiába ismered a szükséges egyenleteket, ha nincsenek a birtokodban a meteorológiai állomások által összegyűjtött adatok.

Az elmúlt húsz évben képessé váltunk arra, hogy digitális úton megszerezzünk minden olyan adatot, aminek segítségével ablakot nyithatunk a jövőre.

Említ egy példát a járvány-előrejelzésre: a Google Flu Trends az influenza terjedését jósolta meg az Egyesült Államokban. Ugyan nem volt túl megbízható, több gond adódott vele, de az olvasottak alapján mégis hasznos tapasztalat lehetett, mert megmutatta, hogy egy ilyen előrejelzés során mi működik és mi nem.

A Google Flu Trends briliáns ötlet volt, mert ahelyett, hogy azt nézte volna, mi történik a kórházakban, azt vizsgálta, hogy a Google keresőjében hogyan keresnek rá a felhasználók az influenzára, vagy annak tüneteire. Ha van egy okos, mesterséges intelligenciával működő algoritmusom, annak meg tudom tanítani, hogy a keresési eredményeket vesse össze az influenzajárványokkal kapcsolatos korábbi információkkal, és máris kapok egy eredményt, ami alapján előrejelzést tudok készíteni arról, hol és hogyan fog terjedni a járvány.

De ez valójában nem ilyen egyszerű. Az nem működik, hogy bedobok a gépbe egy csomó adatot, és kapok egy választ. Értenem kell a működési elvet és a technológiát, illetve annak változásait is. Mert ha a Google megváltoztatja azt, hogy hogyan javasolja a keresőszavakat, akkor az algoritmust is meg kell változtatni. Ezen felül az influenza is változik évről évre, és az emberek is megváltoztathatják a viselkedési szokásaikat. A Google Flu Trends kezdetben nagyon sikeres volt, aztán elkezdtek jelentkezni a bajok, azokat megoldották, majd még több probléma keletkezett. De végeredményben hasznos volt, mert ennek a kísérletnek a során rájöttünk, mit kell csinálnunk ahhoz, hogy rossz legyen az eredmény. Most már nemcsak a Google-t használjuk, hanem a mobiltelefonok által kinyert adatokat, a biztosítási követeléseket, a kórházak, sürgősségi osztályok által szolgáltatott információkkal együtt, és ezeket adjuk hozzá az algoritmusokhoz, hogy pontosabban tudjuk leírni a járvány terjedését. A Google Flu Trends az első példája volt annak, hogy mire lehet használni a mesterséges intelligenciát, és az ott tanultakat ötvözzük a fejlettebb technológiával. Így már öt-hat éve az Egyesült Államokban az influenzaszezonban egy nagyobb csapat rendszeres előrejelzéseket tud készíteni.

Az algoritmusok meghatározzák az életünket – de jó ez nekünk? 1 — Fotó: Balogh Zoltán /MTI

Van olyan, hogy túl sok adat? Hogyan választják ki a megfelelő információkat a projektekhez?

Ez fontos kérdés, mert mostanra valósággal elárasztanak bennünket az adatok. Mindenhonnan érkezik információ, de nem mind érdekes. Ez az egyik nagy tudományos kihívás, hogy hogyan tudjuk kinyerni a tudást és az értelmet a tengernyi adatból. Mint tűt keresni a szénakazalban: végtelen mennyiségű információ áll a rendelkezésünkre, de meg kell találni azt az egyet, amely releváns számunkra. Alapvetően ezen a problémán dolgozunk.

A könyvben említek egy cikket, amelyet Chris Anderson írt a Wiredre azzal a címmel, hogy The End of Theory (Az elmélet vége). Ebben azt mondja, mostantól elég annyi, hogy vesszük az adatot, betápláljuk a gépbe, az pedig megadja a választ. Ez tévedés. Értenünk kell az elméletet, és rendelkeznünk kell tudással ahhoz, hogy mérlegelni tudjuk az új adatokat, így találhatjuk meg a hasznos tudást, a tűt a szénakazalban. Ezért kérik azt mindig tőlünk, felhasználóktól, hogy hadd követhessék azt, mit csinálunk az interneten, mert az egyes emberre vonatkozó adatokra, a tűre van szükségük.

De az adatok nagy része szemét, és használhatatlan.

Ahhoz szoktunk hozzá, hogy kis mennyiségű, meghatározott módon kezelt adatra alapozzuk a tudományt, most viszont eljutottunk oda, hogy rengeteg az adat, és nekünk kell kihalászni a releváns információkat. Eközben persze a tudomány egy evolúciós folyamat, nem dobjuk ki a múltbeli eredményeket, hanem összevonjuk az újakkal. Éppen ezért az én válaszom a Wiredben megjelent cikkre az, hogy „Meghalt az elmélet, éljen az elmélet!”, mert szükségünk van az elméletre és a kisebb kísérletekre, hogy aztán a nagy mennyiségű adatból ki tudjuk szűrni a hibákat. Ez egy új szemlélet, részben azért, mert sokan még nem tudták elfogadni azt, hogy előre tudunk jelezni dolgokat, és be tudunk tekinteni a jövőbe. 10-15 évvel ezelőtt még csak le sem tudtuk írni ezt a jelenséget.

Az influenza amerikai terjedését vizsgáló Google Flu Trends-szel ellentétben önnek és a csapatának volt egy olyan projektje, amelyben megbízható eredményeket tudtak felmutatni. Ez modell a Zika-vírus latin-amerikai terjedését volt hivatott előrejelezni.

Fontos leszögeznünk, hogy nincs egyetlen modell, amelyet az összes járványra lehetne alkalmazni, mert minden járvány és minden vírus más. A Zika egy olyan betegség, amelyet szúnyogok terjesztenek, ezért ebben az esetben egy ponton be kellett hozni a szúnyogokat az egyenletbe, és szükségünk volt nagyon részletes térképekre arról, hogy mennyi szúnyog van a világon, és hogyan lépnek interakcióba az emberekkel. Ezeket az adatokat gépi tanulású algoritmusokkal összesítettük, majd olyan modellekben használtuk, amelyek tartalmazták azt, hogy hogyan utaznak az emberek egyik helyről a másikra, mennyire voltak kitéve a szúnyogoknak, és ez alapján meg tudtuk jósolni a járvány előrehaladását.

De az új típusú koronavírus esetében más a helyzet, mert emberről emberre terjed, légúti megbetegedésről van szó, és azt is meg kell értenünk, hogy a vírus hogyan viselkedik a fertőzött emberek testében. Ilyen módon a beavatkozás is más: az egyik esetben úgy lehet visszaszorítani a betegséget, hogy elpusztítjuk a szúnyogokat, míg a másik esetben elkülönítve kell tartanunk az embereket egymástól. Az a munka, amit mi végzünk, valahol a tudományos és a taktikai, gyakorlati munka között helyezkedik el, mert segítségére vagyunk azoknak a döntéshozóknak, akik ténylegesen kezelik a krízist.

Az algoritmusok meghatározzák az életünket – de jó ez nekünk? 2 — Fotó: Farkas Norbert /24.hu

Azt mondja, hogy a különféle járványok különféle modelleket igényelnek. Könnyebb az új típusú koronavírus-járvány terjedését előrejelezni, mint a Zika-vírusét?

Nem mondanám, hogy könnyebb, mindkettő kihívást jelent. A Covid-19 azért, mert minden hihetetlenül gyorsan történt, ez egy olyan betegség, amely nem ad sok időt a gondolkodásra. Az első telefonhívást az új típusú koronavírussal kapcsolatban január közepén kaptuk, és február közepén már láthattuk előre, hogy nemzetközi méretű pandémiáról lesz szó – ez négy hét. Így össze kellett szednünk magunkat, és nagyon rövid idő alatt modelleket és algoritmusokat alkotnunk. Ami szintén kihívást jelentett, hogy ez egy teljesen új betegség. A Zika-vírus esetében már volt egy alaptudásunk, és van néhány olyan betegség, amelyik nagyon hasonlít hozzá, mint például a dengue-láz.

A Covid az elmúlt évek egyik legnagyobb feladatát támasztotta elénk, mert nulla információról indultunk, és néhány hét alatt sikerült legalább valamiféle útmutatást kidolgoznunk. Ennek a feladatnak a teljes tudományos közösség soha nem látott módon állt neki – lenyűgöző, ha belegondolunk abba, hány kutatócsoport kezdett el egyszerre dolgozni.

Jóllehet a járványok előrejelzése fontos és hasznos dolog, a könyvében van egy kijelentés, ami rámutat arra, hogy a hálózattudomány ennél jóval széleskörűbb, a fertőzéselmélet túllép az epidemiológia területén, és szimulációs modellek hatékonyságával kombinálva kiterjeszthető a marketingtől a hírek terjedéséig.

A hálózatelmélet, a gépi tanulás és a big data kombinációját nemcsak betegségeknél lehet alkalmazni, hanem bármilyen fertőző jelenség esetében. A hírek, a tudás, az információ és az álhírek terjedése is fertőzés. A folyamat legvégén pedig ott van az, hogy tudjuk, kinek milyen az érdeklődési köre, és ennek megfelelően ajánlhatunk neki tévésorozatot vagy könyvet, amiről úgy gondoljuk, hogy tetszeni fog neki. Az algoritmusok és az adatok forradalma belépett az életünkbe. Ha csak egy napunkat vesszük, algoritmusok ajánlanak nekünk zenéket, ha hitelt akarunk felvenni, a bank egy algoritmust fog lefuttatni, hogy ellenőrizzen bennünket.

Amikor a jövőről és a tudományról beszélünk, mindig az jön elő, hogy a robotok fognak bennünket megölni vagy megmenteni. Én azt mondom, hogy már most a jövőben élünk, hiszen ezek a robotok és ezek az algoritmusok már itt vannak. Minden nap kommunikálunk velük a mobiltelefonunkon és a számítógépünkön keresztül, a kormányok pedig nagyszabású algoritmusok segítségével jósolják meg a gazdasági és egészségügyi történéseket, vagyis ezek a módszerek már most is kihatnak az életünkre. Az önök nagyszerű tudósának, Barabási Albert-Lászlónak van egy elmélete, a siker tudománya, amelynek segítségével előre lehet jelezni, hogy az egyes művészek vagy kutatók mennyire lesznek sikeresek a jövőben. Ezek fontos eredmények, ugyanakkor súlyos következményekkel is járhatnak – biztos, hogy akarom használni ezt a hatalmat? Biztosan azt akarjuk, hogy algoritmusok döntsenek az életünkről? Mi a kockázata annak, amit én az önmegvalósítás próféciájának hívok? Ezek bonyolult kérdések, és még ha sokakban nem tudatosul is teljesen, nagyon is aktuálisak.

A társadalmi fertőzés kifejezést is használja, ami jól leírja azt, hogy milyen világban élünk.

Állandóan és folyamatosan fertőzzük egymást, a fertőzés mindenhol ott van. Van, amikor ez egy vírus vagy egy baktérium, más esetben tudás vagy egy ötlet, vagy akár egy pletyka vagy egy történet.

Ha ön ír egy cikket, bármi legyen is benne, meg fogja fertőzni az embereket, valamit át fog nekik adni. Minden a hálózatokban történik. Ez pedig veszélyes is tud lenni, és nemcsak akkor, ha vírusokról van szó, hanem akkor is, ha valaki álhíreket terjeszt. Ráadásul az álhírek egyre gyorsabban és egyre messzebbre jutnak el.

Olyan információalapú társadalomban élünk, amelyben nagyon könnyen terjednek a félrevezető hírek, amelyek hatással vannak az életünkre, és arra, ahogyan gondolkodunk. Ha pedig mainstreammé válnak, akkor tényleg meg tudják változtatni az egész társadalom gondolkodását. Ez ismét egy lényeges aspektusa a fertőzéselméletnek, ezért a társadalmi fertőzés modellje alapvető fontosságúvá válik. A világon számos olyan csoport létezik, amely próbálja megtalálni a módját annak, hogyan lehet a jó információ terjedését elősegíteni, a rossz információét pedig megakadályozni, de ez egyre nehezebb. Olyan, mintha az interneten és a közösségi médiában vívnánk háborút.

Úgy fest, hogy egyes közösségimédia-platformok is megpróbálnak tenni valamit az álhírek ellen. De amíg a Twitter a közelmúltban elrejtette Donald Trump egyik bejegyzését, a Facebook nem volt hajlandó törölni az amerikai elnök rémisztgetésnek is tekinthető bejegyzését.

Szkeptikus vagyok azzal szemben, hogy ezt a problémát rögtön a forrásnál kezelni lehet ilyen módon, mert ez azt feltételezi, hogy van egy bíró, aki eldönti, hogy mi jó és mi nem. Természetesen bizonyos esetekben segíthet egy moderátor, de ez nem elég, nem követhetjük nyomon több millió ember internetes tevékenységét, ezért más módszert kell találnunk. A könyvem végén arról van szó, hogy az embereknek tisztában kell lenniük az új technológiákkal és azok problémáival. Nem bízhatjuk rá magunkat teljesen az algoritmusokra, a gépekre vagy a hírekre. Minél jobban odafigyelünk, és minél többen rendelkezünk azzal, amit úgy nevezek, hogy számítógépes műveltség, annál pontosabban fogjuk tudni megítélni az információkat.

Azt szoktam mondani, hogy száz évvel ezelőtt óriási harcot vívtunk azért, hogy mindenki megtanulhasson írni és olvasni. Ez most már nem elég, számítógépes és tudományos műveltségre van szükség, enélkül olyanok vagyunk, mintha analfabéták lennénk. Mindenkinek van mobiltelefonja, mindenki kapja a híreke, a reklámokat – látnunk kell, hogy mi van a motorháztető alatt, és értenünk kell, hogyan működik.

Hiába tudják egyre többen azt, hogy folyamatosan adatokat gyűjtenek róluk, a legtöbben annyival elintézik ezt, hogy na és, mi van akkor, ha a Netflix tudja milyen filmeket nézek, vagy a Spotify látja, milyen zenét hallgatok. Pedig sok esetben személyes, privát információkról van szó.

Amiket aztán sokszor és sokféleképpen fel lehet használni, és nem csak arra, hogy filmet ajánljanak nekünk. Lehetőséget ad a profilozásra, mivel néhány összetevő segítségével ki lehet deríteni, valaki hogyan gondolkodik. A közösségi média nemcsak arról szól, hogy mit lájkolunk, hanem Facebook-posztokban és Twitter-üzenetekben leírjuk azt, amit gondolunk. Ez azért lényeges, mert megváltoztatja azokat az algoritmusokat, ahogy ezek a gépek kommunikálnak velünk.

Mondhatja azt valaki, hogy őt nem érdekli, milyen filmet ajánl neki egy platform, de egy idő után megjelenik a buborékhatás, és csak azt fogjuk látni, amit ajánlanak nekünk: egy külső erő fog minket irányítani a saját felfedező ösztönünk helyett.

Kényelmes dolog, hogy vannak ezek az eszközök, de óvatosnak kell lennünk, és ha értjük a működésüket, akkor mondhatjuk azt egy filmajánlatra, hogy kösz, inkább most olvasok egy könyvet.

Az algoritmusok meghatározzák az életünket – de jó ez nekünk? 3 — Fotó: Farkas Norbert /24.hu

Az algoritmusok etikus használatát is meg kell tanulni – erre is felhívja a figyelmet a könyvében.

Kell húzni egy határvonalat, hogy mi az az információ, amihez még hozzájuthatunk egy embertől, és mi az, amihez már nem. És nem is csak az adatról van szó, hanem az előrejelzésekről is. Például ha csinálok egy előrejelzést, amely megmutatja, mekkora az esélye annak, hogy elkapja az influenzát, ha elmegy moziba vagy ha részt vesz egy baráti vacsorán, akkor az mennyire etikus? Mert mi van, ha úgy dönt, nem megy el a vacsorára, és ezért lemarad arról, hogy ott megismerkedjen élete szerelmével? Vagy nem megy el moziba egy ismerősével, aki be tudná önt mutatni a jövendőbeli munkaadójának? Mi az a pontossági szint, amivel az előrejelzésnek rendelkeznie kell? Ha meg tudom jósolni, hogy egy könyv mennyire lesz sikeres, és az algoritmus szerint ennek az esélye 100 százalék, az jó. De ha csak 20 százalékot mutat, az nagy bizonytalanságot jelez. Nem lenne jó, ha ez beszűkítené a látóterünket, és nem lennénk hajlandók kockáztatni.

Vannak nagyobb szabású etikai kérdések is kormányzati és szervezeti szinten. Vannak olyan magáncégek, amelyek óriási mennyiségű forrással és adattal rendelkeznek, és bizonyos esetekben nagyobb hatalmuk van, mint kormányoknak abból a szempontból, hogy mihez férnek hozzá, és mit tudnak előrejelezni. De olyan is van, hogy egyes országok olyan gazdasági előrejelzéseket tudnak készíteni adatok alapján, amilyeneket más országok nem. Sok olyan tényező van, ami hozzájárul a digitális szakadék létrejöttéhez. Ez több annál, mint hogy van-e elegendő számítógép meg megfelelő sávszélességű internet, a digitális szakadék valójában arról szól, hogy ki mennyire képes olvasni és előrejelezni a világot.

Kiemelt kép: Libri Kiadó

D. Kovács Ildikó további cikkei

Az algoritmusok meghatározzák az életünket – de jó ez nekünk?

Alessandro Vespignani

Ajánlott videó

Friss

Népszerű

Címlapról ajánljuk

Szintlépés, pozíció-visszanyerés, kockázat: ez várhat a felekre egy Fradi–Gazprom frigyben