A külföldi sajtó szeptemberben számolt be arról, hogy a Zhenhua Data nevű kínai cég grandiózus adatbázist állított össze mintegy 2,4 millió emberről és 650 ezer szervezetről. Nem csak kínaiakról.
Elemzők szerint ez az első közvetlen bizonyíték arra, hogy a kínaiak a saját határaikon kívül is megfigyelnek külföldi személyeket és intézményeket. Itthon elsőként a Szabad Európa szúrta ki, hogy vannak magyar érintettek is, több mint hétszázan. A szakértők hetek óta vitatkoznak arról, mennyire meglepő ez, egyesek a Facebook-féle Cambridge Analytica-botrányhoz hasonlítják a történteket, mások szerint ahhoz nem fogható.
Mit csinál a Zhenhua Data?
A sencseni Zhenhua Data Information Technology Co. egy big data cég, ami nyílt forrásokból gyűjt össze adatokat. A megfigyelt célpontok közt vannak egyének, politikai, kormányzati intézmények, cégek, médiapiaci szereplők – gyakorlatilag bárkiről és bármiről tárolhatnak információkat.
Ugyan a Zhenhua a neten bárki által szabadon hozzáférhető adatokat fésüli össze egy helyre, sok demokratikus országnak mégsem tetszik ez. A cég háttere kormányzati szálakat sejtet: a vállalat a Zhenhua Electronics Group tulajdonában van, ami a China Electronics Technology Group (CETC) alá tartozik. Ők pedig állítólag a kínai kormánnyal dolgoznak, a hírszerzők és a hadsereg munkáját segítik, és naivitás is lenne azt hinni, hogy nem így van.
Hogyan került elő az adatbázis?
A Tengerentúli kulcsinformációs adatbázis (Overseas Key Information Database, OKIDB) néven emlegetett, magyar adatokat is tartalmazó csomagot egy szivárogtató nyújtotta át Christopher Balding Kína-kutatónak. A szakértő korábban tanított a Pekingi Egyetemen, majd biztonsági okokra hivatkozva hazatért az Egyesült Államokba. Olyan forrástól kapta a csomagot, aki elmondása szerint tettével „nagy kockázatnak tette ki magát”. Balding az adatokat ezután az Internet 2.0 nevű, ausztrál kiberbiztonsági cégnek küldte el elemzésre, amely az amerikai és ausztrál kormánnyal is dolgozott már együtt adatvisszaállítás- és elemzés kapcsán. A Telex is ezen cégtől kérte ki az adatokat a magyar nevekkel.
Kiket figyeltek meg?
Az Internet 2.0 belevetette magát a csomagba, ami elemzésük szerint közel 250 ezer ember adatait tartalmazza, köztük 10 ezer brit, 35 ezer ausztrál és 52 ezer amerikai lakosét. A jelentés szerint csak a kiszivárgott, sérült adatcsomag tíz százalékát tudták visszaállítani.
bár hozzá kell tenni, hogy a magyarok meglehetősen kis részét teszik ki az adatcsomagnak, és a kínaiakat elsősorban az amerikaiak érdeklik.
A listán szerepelnek közéleti személyiségek, így politikusok, de hivatalnokok, bírók, mérnökök, katonák is. A célszemélyek ismerősi körét is feltérképezték, a köztük lévő kapcsolatokkal együtt. A döntéshozók közül többek közt Boris Johnson brit, Scott Morrison ausztrál, Narendra Modi indiai miniszterelnök és családtagjaik, számos ország miniszterei, továbbá a brit királyi család tagjai említhetők, de a kínaiak más országok hadseregeinek magas beosztású katonáit, szoftverfejlesztőit, cégvezetőit és elítélt bűnözőket is lenyomoztak.
A magyarokról 2018 júliusában kezdődött az információgyűjtés, az adatbázist folyamatosan frissítették, és nagy eséllyel a kiszivárgott verziónál frissebb változata is létezik. Politikusok és diplomaták mellett rendőrkapitányok, bírák, programozók, pénzügyi szakemberek, egyházi vezetők is szerepelnek a listán, de adatvédelmi okokból csak a közszereplők neve írható le. A Szabad Európa szerint a listán az összes miniszterelnök szerepelhet, lévén szinte mindegyiküknek legalább egy rokona megtalálható az adatbázisban.
Így Medgyessy Péter és Bajnai Gordon rokonai, Orbán Viktor egyik gyerekének neve, továbbá Rogán Antal, Tuzson Bence, Lázár János, Kósa Lajos, Trócsányi László, Tarlós István, Gyöngyösi Márton, Hiller István, Ángyán József, Dávid Ibolya és Vona Gábor hozzátartozói. De a Magyar Nemzeti Bank munkatársait, a Közbeszerzési hatóság két volt elnökét, a MÁV korábbi vezetésében részt vevőket, valamint Hegmanné Nemes Sára volt államtitkár, a Magyar Posta elnökének nevét is megtalálni a sorban.
Milyen adatokat gyűjtöttek a kínaiak és honnan?
Az elemzők szerint a big data cég 2,3 milliárd cikk és 2,1 milliárd közösségimédia-poszt alapján állította össze az adatbázist. Olyan közösségi oldalakról is harácsoltak, mint a Twitter, a Facebook, a LinkedIn és a Crunchbase, illetve üzleti aggregátor-oldalakról, bűnügyi nyilvántartásokból.
A Zhenhua a célszemélyek digitális lábnyomát vizsgálta, tehát a neten szabadon begyűjthető (OSINT) információkat. Ilyenek például a közösségi profilok, az üzleti adatbázisok linkjei, a születési idő, a telefonszám, az e-mail cím, a családi állapot, a pártállás, egyeseknél képek, leírások, megjegyzések is voltak arról, miért érdekes az illető. Ezek alapján pedig az egyes vizsgált személyek, intézmények közti kapcsolatokat is fel lehet tárni.
Az Internet 2.0 elemzői szerint az OKIDB 80 százaléka nyílt forrásból származó információ, viszont az adathalmazok komplexek, többféle forrásból származnak, nagyon fejlett eszközökkel kezelték őket. Vannak köztük elsőre haszontalannak tűnő információk is, amik idővel hasznossá válhatnak, hiszen a tömeges adatgyűjtés mindig hosszú távú célokat szolgál. A többi 20 százalék viszont offline vagy nehezen hozzáférhető adat. Ezeket a felhasználók osztották meg (akár a hirdetőkkel vagy a közösségi platformokkal), de nem feltétlenül nyilvánosan. És vannak olyan információk is, amikről a kutatók sem tudják, hogy honnan származhatnak – nem lehet kizárni, hogy lopottak.
Mire kellhet nekik?
Felmerül a kérdés, mi a baj a nyilvánosan hozzáférhető adatokkal, amiket például az internetes óriáscégek is gyűjtenek? Ezekbe általában beleegyezünk a regisztrációkor a felhasználói szerződés elfogadásával, a probléma az, hogy az aggregált és tömeges információgyűjtést a közösségi oldalak szabályzata is tiltja – a Facebook például le is tiltotta a Graph API-t, ami korábban erre lehetőséget adott.
A kínaiak külföldiekről készült adatbázisa a kormány és a hadsereg hírszerzését segítheti, és taktikai manőverezésnek is teret ad, ha a puzzle darabkáit összeillesztik, a szálak összekötésével láthatóvá válik, ki kivel áll kapcsolatban. A hírszerzők alapvetően ilyen jellegű információkat gyűjtenek.
A szakértők most még nem tudják megmondani, milyen célból épülhetett az adatbázis, vagy korábban milyen ügyekhez hasznosíthatták aktívan. Vannak viszont feltételezések a legvalószínűbb felhasználási módokról: például dezinformáció terjesztése, manipulált (deepfake) videók készítése, illetve annak az információs környezetnek a megzavarása, felkavarása, amiben a demokráciák működnek. Összességében előny annak ismerete, hogy ki kivel áll kapcsolatban, hogyan lehet őt zsarolni, mik lehetnek a gyengeségei. A Zhenhua Data vezetője, Vang Hszüefeng korábban nyíltan kijelentette, hogy támogatja a hibrid és a pszichológiai hadviselést, több fórumon és közösségi oldalon is beszélt az ilyen módszerek fontosságáról.
Na de mit szól hozzá a Zhenhua Data?
A kínai vállalat nem nagyon akar nyilatkozni a médiának. Egyedül a The Guardiannak reagált annyit, hogy csak olyan adatokkal dolgoznak, amelyek bárki által elérhetők a neten, a tengerentúlon is számos ilyen platform létezik. A cég Sun néven nyilatkozó képviselője szerint ők csupán adatintegrációt végeznek, az üzleti modelljükkel és partnereikkel kapcsolatos részletek pedig üzleti titoknak minősülnek. Igaz, az OKIDB létezését megerősítették, de kijelentették, hogy csak kutatási célzattal készült és nem a közösségi média profilokra épült. Továbbá elutasították, hogy együttműködnének a kínai kormánnyal és hadsereggel. A Zhenhua honlapja viszont már nem érhető el, mióta napvilágra került az ügy.
Ez most akkor meglepő, durva vagy ijesztő?
Meglepő, hogy Kína külföldiekről gyűjt össze online adatokat, és elemzi azokat? Valójában nem. A The Guardian cikkében idézi Anne-Marie Brady Kína-kutatót, aki szerint a mostani felfedezésben az a szokatlan, hogy big data módszereket használtak kémkedéshez, és egy privát cégnek szervezték ki a feladatot. A kínai kommunista párt jó ideje gyűjt adatokat a külföldi politikai és gazdasági elitről, és azokról, akik egy ideig Kínában éltek.
Makay József etikus hackert, kiberbiztonsági szakértőt az adatbázis létezése egyáltalán nem lepte meg.
Többségében olyan információkat tartalmaz, amiket az egyre fejlettebb, publikus forrásokból dolgozó OSINT (Open Source Intelligence) adatgyűjtő-rendező-feldolgozó szoftverek és szolgáltatások manapság már viszonylag kevés erőforrás befektetésével képesek automatikusan begyűjteni. Az interneten rengeteg ilyen, nyilvános forrásokból származó személyes adatokat tartalmazó adatbázis kering és érhető el akár laikusok számára is.
A szakértő szerint a csomag három tulajdonsága miatt hívta fel magára a figyelmet:
- az adatbázis létrehozójának kínai kiléte,
- az összeállítás végfelhasználásának ismeretlen és gyanús célja,
- valamint az adatbázisban megtalálható befolyásos és/vagy közismert személyek listája.
Utóbbival kapcsolatban biztos vagyok, hogy sok érintett teszi fel magában a kérdést: Miért gyűjtötték be rólam az adatokat? Ezt a kérdést pedig azért teszik fel, mert az internetezők túlnyomó többsége még ellentétes esetben sem gondolja magát annyira érdekesnek vagy fontosnak, hogy ilyen „botrányba” keveredjen. Viszont sosem lehetünk biztosak abban, hogy mi lehet velünk kapcsolatban érdekes információ, ha még azok lehetséges felhasználhatóságát sem ismerjük
– fejtette ki a szakértő.
Makay szerint hétköznapi felhasználóként is érdemes belegondolnunk, hogy gyengén védett cégeknek adjuk oda az összes publikus és privát információnkat, személyes kommunikációkat és az internetes tevékenységünk során a gondolatainkat, miközben van olyan algoritmus, ami akár 90 százalék feletti pontossággal meg tudja mondani egy felhasználó szexuális orientációját csupán a profilképe alapján. Ebből kifolyólag pedig érdemes figyelni arra, hogy sokkal jobban odafigyeljünk a személyes adataink védelmére biztonságtudatossággal és a megfelelő védelmi technológiák alkalmazásával.
Kiemelt kép: Getty Images