Mostantól magyarul is működik a Google Translate egyik legmenőbb megoldása, a Word Lens. Ez nagyjából úgy működik, hogy telefonon megnyitjuk a Translate appot, amelyben a kamera ikonra nyomunk. Ezután a mobil kamerájával fókuszba fogjuk az idegen nyelvű szöveget, amit az app azonnal lefordít és a helyére a választott nyelv szerinti szöveget teszi. Nagyjából így:
Ez a funkció eddig csak hét nyelven működött, természetesen a gyakran beszélteken, ma azonban 20 további nyelven is elindul, köztük magyarul. A Word Lens egyébként nagyjából annyira tűnik instant jövőnek, vagy varázslatnak, mint a bluetooth-fejhallgatók, szóval nagyon érdemes kipróbálni. Ráadásul azzal ellentétben, amit egyébként gondolnánk, még csak nem is nagyméretű alkalmazásról van szó. Egy nyelvi fájl körülbelül két megabájt, és onnantól, hogy leszedtük, internet nélkül is működik. Ezért mondjuk kiváló arra, hogy külföldön feliratokat fordítgassunk vele anélkül, hogy az adatroaminggal brutális mobilszámlát hozzunk össze.
A Word Lens alkalmazáson dolgozó csapat, és az egész megoldás kitalálója egy Hangouts-beszélgetésben nagy vonalakban elmondta, hogyan működik a fordítás (legalábbis igyekeztek, mert nem mindenki van ennyire elmerülve a neurotudományokban és a programozásban). Van egy angolul “deep convolutional neural networks”-nek nevezett megoldás, amit inkább meg sem próbálok lefordítani magyarra, mert önmagam bukását okoznám vele. A lényeg, hogy a szövegfelismerő algoritmus nagyjából az emberi agy működését utánozva ismeri fel, hogy mit lát pontosan a képen. Olyan lehet, mint a Google Photos képfelismerése, de ezt például Octavio Good, a Word Lens ötletgazdája nem tudta megerősíteni. Nem azért, mert nem ért hozzá, hanem mert nem dolgozott a Google Photos-on.
A Google egyébként azért is tartja annyira fontosnak ezt az egészet, mert az interneten jelenleg elérhető szövegek 80 százaléka angolul van, miközben csak az emberiség 20 százaléka beszéli a nyelvet. Van egy Translate Community nevű közösségük is, ahol a különböző nyelveken remekül beszélő emberek ellenőrzik a fordításokat. Például azért, hogy ne legyen az, mint az orosz-angol nyelvpárral, amikor a csapat szerint a bedbug (poloska) szót hibákkal teli ágynak fordította a Translate, mert félreértette a bug kifejezést.
Amúgy a nyelvek dokumentálásában és felismerésében sokat segít, hogy a Google gyakorlatilag az összes interneten adott nyelven elérhető írott dokumentációt végigpásztázta. Ezt nyilván bizonyos nyelveknél könnyebb, másoknál nehezebb megtenni. A csapat szerint a kazah nyelv például kifejezetten nehéz volt, mert alig találtak írott dokumentumokat az interneten. Magyarból persze azért volt bőven.
Amúgy azért egy darabig – ki tudja meddig – még eltart majd, amíg grammatikailag és morfológiailag helyesen fordít magyarra a Translate, már csak a nyelvtani sajátosságok miatt is, de folyamatosan dolgoznak a finomításokon. Emellett a képi felismerésnek is vannak határai, hiszen amíg a kézírást gyakran egy másik ember sem tudja elolvasni, nem várhatjuk a géptől, hogy majd neki menni fog. A Translate Android és iOS alatt futó változata hamarosan frissülni fog, hogy már a magyar szókészletet is felismerje.
Kaptunk egyébként egy remek listát is arról, milyen szavakra keresnek a legtöbben a Translate-ben.
Magyarból ez a 10 leggyakrabban lefordított szó:
- 1. szeretlek
- 2. szia
- 3. nem
- 4. köszönöm
- 5. igen
- 6. kik
- 7. hogy vagy
- 8. hol
- 9. nem értem
- 10. nem tudom
Külföldiből magyarra pedig ez:
- 1. hello
- 2. how are you
- 3. thank you
- 4. كيف حالك
- 5. نعم
- 6. مرحبا
- 7. what
- 8. awesome
- 9. yes
- 10. I love you