Egy új – igaz, csak virtuális – világ tárul ki annak, aki rászánja magát, és internetelérést vásárol. Az indokok egy ilyen döntésnél eltérők, ki szórakozásra vágyik, kinek a munkájához kell, sokan pedig azt remélik, hogy saját vállalkozásuk felvirágoztatásában tudják majd hasznosítani a világhálót.
A várakozás persze mindegyik esetben megalapozott, hiszen napjainkra szinte minden információ fellelhető a weben. Üröm az örömben, hogy azok túlnyomó többsége a csak magyarul beszélő felhasználó számára egyelőre elérhetetlen, legyen szó akár a zenei, a sport-, a gazdasági élet legfrissebb híreiről vagy a hazai gazdák számára kulcsfontosságú európai uniós támogatási rendszerről, új szabályokról, lehetőségekről, pályázatokról.
Tolmácsolt szavak
Bár a tudományos-fantasztikus regényekben és filmekben időnként felbukkanó univerzális fordítógép még nem áll rendelkezésünkre, azért vannak már próbálkozások arra, hogy az idegen nyelvet nem beszélők – a magyar lakosság több mint 80 százaléka – számára is elérhetővé váljanak a más nyelvű információk. Igaz, a hazai fejlesztők által kidolgozott weboldalfordító megoldások nem adnak teljesen pontos fordítást, mégis hasznos segítséget nyújthatnak az idegen nyelvű – egyelőre angol – oldalakat felkeresők számára. Magyarországon jelenleg két cég uralja az internetes fordítói piacot, a Morphologic Kft. és a Dativus Translator Kft., amelyek a múlt évben új megoldással jelentkeztek.
Az utóbbi tavaly májusban tett közzé egy olyan megoldást, amelyben itthon egyedülálló módon weboldalfordítót is elhelyeztek. A Windows operációs rendszerek internetböngészőjébe, az Internet Explorerbe épülő program egy kattintásra lefordítja az angol nyelvű oldalakat magyarra, illetve a magyarokat angolra. Nem sokkal később a Morphologic is kiadta saját változatát, amely a cég honlapján és a webforditas.hu címen is elérhető. Míg a Dativus megoldása előfizetéses, addig a Morphologicé ingyenes, igaz, csak angolról magyarra fordít. A „magyarosítás” során mindkét program megőrzi az eredeti oldal formátumát, azonban míg a Morphologic alkalmazása támogatja az átkattintást, vagyis egy már magyarra fordított oldalon lévő linkre kattintva egy másik magyarított oldalt nyit meg a felhasználó, addig a Dativus szoftvere ezt nem tudja, így minden egyes újonnan nyitott oldalt újra kell fordíttatni.
Kampány nélkül
Többnyelvű keresés
A szövegminta- gyűjtést, vagyis a statisztikai megoldást választották a Google webfordítójában is. A június elején további elemekkel kibővített szolgáltatás egyelőre tizenkét nyelven érhető el: az angol mellett többek között arabul, kínaiul, oroszul és spanyolul, magyarul sajnos még nem. A megoldás lényege, hogy a – szerencsés 12 nyelv valamelyikét beszélő – felhasználó saját anyanyelvén adhatja meg a keresés kulcsszavát, majd beállíthatja, hogy milyen nyelven keressen találatokat a szolgáltatás. A végeredmény pedig újra a felhasználó saját nyelvén jelenik meg. Persze azt a Google-nél is elismerik, hogy a gépi fordítás még messze nem tökéletes. Szakértők szerint soha nem is lesz az, azonban hasznos segédeszköz lehet azon felhasználók számára, akik olyan nyelvű információt keresnek, amelyet egyáltalán nem vagy csak kevéssé beszélnek.
Tudta-e?
Az Egyesült Államok hadserege több ezer fordítógépet használ Irakban, igaz,
ezek csak az egyszerű angol kifejezések, mondatok arab megfelelőit adják
meg. Azonban már tesztelik azokat a nagyobb adatbázissal felszerelt
intelligens eszközöket is, amelyek mindkét irányban lehetővé teszik a
fordítást.
Internethasználók száma
(nyelv szerinti megoszlás, 2007. május, millió)
Angol 326,78
Kínai 166,00
Spanyol 100,97
Japán 86,30
Német 58,71
Francia 56,37
Portugál 40,22
Koreai 34,12
Olasz 30,76
Arab 28,54
Egyéb 200,16
Összesen 1128,93
Forrás: Internet World Stats
Új célok
Az évente 200-250 millió forintos forgalmú, száz százalékban magyar magánszemélyek tulajdonában lévő Morphologic céljai között szerepel a nemzetközi porondra lépés. Technológiájuk megtalálható a Microsoft, az IBM, a Xerox és más nagy cégek termékeiben, de végfelhasználóknak szánt piaci megoldásaik elsősorban Magyarországon és a környező országokban érhetők el. Hamarosan megkezdik azonban az Európai Unió információtechnológiai díjával kitüntetett MoBiMouse szótárrendszer szélesebb körű nemzetközi forgalmazását, elsőként az Oxford kiadó angol, német és spanyol nyelvű szótáraival.
Azok, akik tisztában vannak a gépi fordítás korlátaival, általában elégedettek a Dativus Translator Kft. megoldásával – számolt be a tapasztalatokról Kertész Judit, az 1999 óta szótárprogramokat és fordítássegítő megoldásokat fejlesztő, saját webfordító alkalmazását tavaly tavasszal piacra dobó társaság nyelvészszakértője. Egy gép ugyanis nem képes átlátni az adott szöveg jelentését, értelmezni a szövegkörnyezetet, ezért más megoldást kell keresni.
A tapasztalatok szerint a jónak számító szoftverek is csak 70-80 százalékban dolgoznak pontos találati aránnyal. Bizonyos területeken a fordítógépek teljesítménye azonban már közelíti az emberét: a számítástechnikai szakkönyvek fordításában például kifejezetten jó eredményt érnek el.
Persze a fejlesztőknek nincs könnyű dolguk, amikor a számítógéppel akarják megértetni az emberi nyelvet.
Problémás nyelvek
A feladat megoldására két fő irányvonal alakult ki az elmúlt években. Az egyik módszer a nyelvi összefüggéseket megfogalmazó szabály alapú fordítás, míg a másik elképzelés a nagymennyiségű szöveg elemzésére építő statisztikai eljárás. Az utóbbi megközelítés különösen az Egyesült Államokban népszerű, az ottani fejlesztők szerint ugyanis könnyebb bizonyos nyelvekből nagy szövegmintákat begyűjteni, mint azok nyelvtani szerkezetét részletesen kielemezni. Persze könnyű helyzetben vannak az olyan nyelvek esetében, amelyeket több száz millió vagy milliárd honlapon használnak, hiszen így könnyű begyűjteni a megfelelő mennyiségű mintát. Kisebb nyelvek esetében azonban ez a módszer nem használható, és a szakértők szerint a legjobb eredményt a két eljárás ötvözésével lehet elérni. Ezt az utat választották a magyar fejlesztők is.
A két módszer ötvözetével kísérleteznek egy európai uniós projekt, az Euromatrix keretében is, amelyben magyar részről a Morphologic vesz részt. A tavaly szeptemberben indult fejlesztés lényege, hogy fordítómegoldást hozzanak létre az európai nyelvek között. A jelenlegi projekt két és fél év múlva zárul, akkorra várhatóan sikerül megvalósítani a főbb nyelvcsaládok közötti fordítást– tette hozzá Prószéky Gábor.
Van már olyan társaság is, amely a webfordító alkalmazások fejlesztői számára kínál megoldásokat. A finn Sunda Systems májusban mutatta be új fejlesztőeszközét, amely a gyártó állítása szerint bármely nyelvpárra készülő gépi fordítómegoldásnál használható, vagyis megnyílhat a lehetőség, hogy a kisebb, a nagy fejlesztők figyelmét eddig elkerülő nyelvekre is létrehozzanak automatizált fordítóeszközöket.