Rettegjetek, tolmácsok, hatalmas újítás kapujában a Google Fordító

Valószínűleg kevés olyan ember van, aki nem használja rendszeresen a Google Fordítót. Nem kell szótárral vacakolni, gyors és hatékony, igaz, néha (jó, igazából gyakran) hagy némi kívánnivalót maga után az eredmény.

Viszont rengeteg fontos esemény nem jöhetett volna létre nélküle, például mennyivel unalmasabb lett volna az idén április enélkül.

Fotó: Nyelv és Tudomány

Ezeket a remekműveket is mi más inspirálta volna, mint az online fordító bakijai.

Fotó: tumblr/fuckyeahtoteas

Szeptember végén azonban olyan bejelentéssel rukkolt elő a Google, ami szerint a fordító hatalmas változásokon eshet át a következő időszakban. A Google Translate ugyanis a jövőben új algoritmust használ majd, ami az úgynevezett deep learning technológián alapul. Az algoritmus az első széleskörűen elérhető rendszer, ami az egyre népszerűbb mesterséges intelligenciát használ. A Google kutatói szerint ennek segítségével körülbelül

60 százalékkal csökken majd a hibák száma.

A kínai és angol nyelvek közötti fordításokhoz már az új algoritmust használja a Google, elmondásuk szerint a következő néhány hónapban ezt követi majd a többi nyelv is.

Oké, de mi az a “deep learning”?

Röviden algoritmusok alapján történő keresés, ami könnyebbé teszi a hatalmas mennyiségű információ feldolgozását.

Olyan algoritmusokról van szó, amik segítségével nagy adattömegek dolgozhatóak fel gyorsan és hatékonyan. Mesterséges intelligencia úgy is létrehozható, ha a lehetséges válaszokat előre beprogramozzák több millió lehetséges eseményre. A bejövő információ feldolgozása több lépcsőben történik, több réteg van, amik közül mindegyik a “saját” feladatát látja el.

A fő különbség a fordító eddigi és jövőbeli mechanizmusa között, hogy az eddig szavak szerinti fordítás történt, innentől viszont a mondatokat úgy vizsgálja majd, hogy

a szavakat szószegmensekre bontja fel.

Az elv hasonló, mint amikor az arcfelismerő szoftverek (amilyet például a Facebook is használ) először a képeket pixelenként vizsgálják, majd ezek után az éleket, geometriai mintákat.

Hogy legyen mihez hasonlítani, ehhez hasonló szoftvert használt az az Alphago szoftver is, ami legyőzött egy profi Go-játékost. A fordításban történt előrelépések kimutatásához a Google nyilvánosságra hozott egy dokumentumot, amiben az eddig használt technológia és a jövő közötti különbséget érzékeltetik, és hasonlítják össze egy tolmács fordításával.

A Google egyik kutatója szerint fordítás terén a gépek akkor tudják majd ugyanazt a szintet hozni, mint az emberek, amikor különböző dolgokat egyszerre tudnak majd érzékelni. A vizuális típusok kedvéért:

eddig csak olyan mondatokat láthattak, hogy “a macska leesett a fáról”. A jövőben már videókat is láthatnak fákról leeső macskákról, és irányítanak robotokat, akik látnak, hallanak, mozgatnak tárgyakat, a szenzoraik segítségével fájdalmat képesek érezni, és hozzá tudják kapcsolni tapasztalataikat a szövegekhez.

Igaz, hogy még csak kínai és angol között működik az új mechanizmus, már más nyelvek esetében is összehasonlították a pontosságát a tolmácsokéval, és például az angol-spanyol közötti fordításban közel ugyanolyan pontos volt az ember és a gép. Így nem véletlen, hogy az összes nyelv fordítását már a deep learningen alapuló mechanizmussal végeznék a jövőben.

A Google megkért embereket, hogy hasonlítsák össze az új rendszer fordítását a tolmácsok munkájával, sokszor nem láttak túl nagy különbséget a két eredmény között. A változástól pedig nem csak azt várják, hogy egyszerűbbé válik a különböző weboldalak olvasása vagy egyszerűsödik a kommunikáció azok között, akik nem beszélik ugyanazt a nyelvet. Az egyik kutató szerint ez a lépés nagyban elősegítheti az emberek és a gépek közötti kapcsolatok fejlesztését is.

A távlati cél az, hogy több mint tízezer(!) nyelvpár fordításához használják az új technológiát. Természetesen tisztában vannak azzal is, hogy a rendszer még mindig nem tökéletes, de a projektért felelős csoport szerint már sokkal, de sokkal jobban működik, mint eddig.

(via Technology Review)