A Mesterséges Intelligencia Munkacsoport a NAV egyedülálló adatvagyonának értékére épülő kutatásokat végez. Cél a tudományos módszertanok és az adózási, adóztatási tapasztalatok szinergiájának kihasználása – emelte ki a portálnak az adóhivatali elnök.
A központi költségvetési bevételek védelmére a hivatal kiemelt figyelmet fordít a mesterségesen felépített fiktív láncolatok ellenőrzésére. Ezen csalárd adózók egy bevallási időszakra, vagy az ellenőrzés általi „látókörbe kerülésig” tervezik a tevékenységüket. A jelenhez minél közelebbi fellépéssel teljes mértékben feltárhatók a számlázási láncolatok már a bevallások benyújtását megelőzően is. A kockázatelemzés eredményként már közel 350 láncolatot és annak 4 000 szereplőjét sikerült azonosítani.
A közelmúltból jó példa a nagy sajtóvisszhangot kiváltott Elf Bar-jelenségre a NAV és a Szabályozott Tevékenységek Felügyeleti Hatósága (SZTFH) országos akciót szervezett. Az akcióban 125 ellenőrzés zajlott le, és 52 ellenőrzés még folyamatban van. Az eljárásokban 7 ezer 500 terméket foglaltak le, melyek becsült értéke több mint 19,8 millió forint. Folyamatosan érkeznek most is a 1828-as Elf Bar-bejelentő zöld számra olyan bejelentések, amelyek esetében a NAV fellépése indokolt.
A Mesterséges Intelligencia Munkacsoport márciusban jött létre, vezetője a Budapesti Műszaki Egyetem tanszékvezetője. A csoportot a NAV üzemelteti, működteti, de a tagok többsége NAV-on kívüli. A mesterséges intelligencia segítségével jóval több paraméter alapján csoportosíthatják a cégeket, és aki a számos jellemző alapján kialakított csoport tagjaitól feltűnően különbözőt produkál, nevezetesen jóval kevesebb adót fizet, az az úgynevezett deviáns viselkedésű adózó – tette hozzá Vágújhelyi.
Elárulta, hogy a NAV infrastruktúráján kezelt, tárolt teljes adatmennyiség 11,17 Petabyte. (Egy Petabyte egymillió gigabyte.) Ha csak a NAV napi szakmai alapműködését (ide nem értve a bűnügyi területet) biztosító éles üzemi informatikai rendszerek adatállományát tekintjük, az jelenleg fél Petabyte méretű. Az adatszolgáltatásokat, átfogó és egyedi devianciaelemzéseket biztosító Adattárház mérete is eléri a negyed Petabyte méretet. Összehasonlításképpen, egy Petabyte tárolásához több mint 745 millió floppylemezre vagy nagyságrendileg 1,5 millió CD-ROM-ra van szükség.
Az informatikai fejlesztések adta valós idejű interakciók lehetőségét, és a digitálisan keletkező óriási adatmennyiséget alapul véve, a matematikatudomány módszertanainak szisztematikus alkalmazása a NAV adatvagyonán, összességében a Mesterséges Intelligencia Munkacsoport keretében kialakuló módszerek és eljárások NAV-on belüli tartós működtetésével számos lehetőség nyílik meg.
Lehetőség van közigazgatási szinten a különböző szakismeretek összekapcsolásával újszerű, észszerűbb, költséghatékony együttműködések kialakítása az ügyintézési folyamatok gyorsításán, egyszerűsítésén túlmenően, a rendszerek szorosabb integráltságával, az egyik félnél már kialakított, de egy másik félnél is alkalmazandó informatikai szolgáltatások megosztásával, vagy a rendelkezésre álló adatvagyonban azonosított új, információ értékű adat másik fél ügyintézési folyamatába való beépítésével (például MÁK-NAV adatvagyon-hasznosítás optimalizálása).
Ezeken túl az adóhivatal célja az adatok lehető legmagasabb digitalizálási szintjének elérése, a környezetünkben már meglévő, alkalmazott megoldások ügyintézési folyamatokba való beépítése, így például a biometrikus aláírás alkalmazása a helyszíni ellenőrzéseknél, amellyel papírmentessé tehető még ez a terület is.
A NAV munkavállalóinak jelentős része ezek szerint már informatikával foglalkozik Most nagyjából 18 ezer a létszámunk, amiből mintegy a tíz százaléka a munkatársaknak foglalkozik valamilyen módon informatikával, adatelemzéssel. Létrejött egy önálló kockázatkezelési és adatvagyon gazdálkodási szakterület is – számolt be az elnök.
Rengeteg adatot lát az adóhivatal már, mire használják majd ezt?
A digitális technológiák fejlődése, az elektronizáció térnyerése és a gazdaság fehérítését szolgáló intézkedések (online pénztárgép, online számlaadat-szolgáltatás, EKÁER stb.) hatására keletkező mind hatalmasabb adatvagyon új kihívás elé állította a NAV-ot. Az adatvagyon rendszerezése és jövőbeni, minél teljesebb körű hasznosítása elengedhetetlen az online szolgáltatások biztosításához, folyamatos fejlesztéséhez. Például a foglakoztatással összefüggő adatszolgáltatások egyszerűsítése, automatikus adatátadások biztosítása, ügyféli adatszolgáltatások csökkentése, gyűjtött adatok strukturált visszamutatása stb.
A NAV rendelkezésére álló adatvagyon célzott kiaknázására a NAV Adatvagyon-kataszterének összeállítása után, valamint egy egységes integrált adattárház alapjain és a mesterséges intelligencia lehetőségeit kihasználva kell az adat- és tranzakcióalapú ügyintézés alapjait megteremteni, devianciaindikátorokat bevezetni, deep learning modelleket kialakítani. Ezek a célok szorosan illeszkednek a kormányzati célokhoz, így a DIMOP-feladatok végrehajtásához is – figyelmeztetett.
Mindezt a Mesterséges Intelligencia Munkacsoport is támogatja a NAV egyedülálló adatvagyonára épülő kutatásokat végezve. Többek között javaslatot dolgoz ki a szemantikus adatvagyon-kataszterre, valamint a gépi tanuláshoz szükséges címkézés módszertanára is.
A munkába a NAV mellett bekapcsolódnak többek között minisztériumok (PM, ITM, BM, MK), a Nemzeti Adatvagyon Ügynökség, a Központi Statisztikai Hivatal, a Mesterséges Intelligencia Nemzeti Laboratórium, valamint a Nemzeti Adatgazdasági Tudásközpont, a Digitális Jólét Program munkatársai és külső szakértők is.
A NAV adatvagyon-hasznosítása a középtávú stratégiánk alapja, és jelenleg is a kormányzati döntéshozatal pillére, illetve jelentős adminisztratív adatforrás a társszervek a kutatók munkájának támogatásához. A járványügyi intézkedések mellett például a veszélyhelyzeti megoldások bevezetéséhez, a kormányzati intézkedések végrehajtásának megalapozásához a szervezet naprakész és pontos információkkal, adatokkal látta el a kormányzati-, illetve a társzerveket.
Az adóhatóság elnöke szerint a rendelkezésre hatalmas adatmennyiséget arra kívánják használni, hogy még hatékonyabbá tegyék az adóbeszedést.
Mondhatom, hogy Európában a mi adóhivatalunk látja a legtöbb adatot, mert mi egészen az aljától látunk minden elemi tranzakciót.
A többi adóhivatalnak mi segítünk bevezetni ezeket az újításokat és igazából akkor leszünk nagyon hatékonyak, ha a kör bezárul és egész Európában azonnal látják az adóhivatalok, hogy hol jelent meg deviáns viselkedés – értékelt.