Nyelvi fordulatok

A számítástechnika fejlődésével a gépi fordítás is lendületet kapott. A végeredmény még nem tökéletes, de azért használható.

Vajon hányan olvassák Magyarországon a BBC vagy a CNN internetes híreit? Valószínűleg nem túlságosan sokan. A többségnek nyilván eszébe sem jut ez a lehetőség, akiket viszont esetleg érdekelne, azok zöme a hiányos nyelvtudás miatt mond le az efféle tájékozódásról. E kör helyzetét könnyítheti meg a fordítószoftverek fejlődése. Bár a szkeptikusokat még elborzasztják e programok néha baltával faragott mondatszerkezetei, az mindenképpen a javukra írható, hogy gyorsak, és legalább nagy vonalakban értelmezhetővé teszik a szöveget.

„Ha a New York Times egy példányát odaadnánk egy fordítóirodának, több napig dolgozna rajta. Az embereknek azonban nincs ennyi idejük kivárni a végeredményt, ráadásul olcsón szeretnének minőséget kapni” – mondja Prószéky Gábor, az interneten ingyenes webfordító szolgáltatást (www.webforditas.hu) is üzemeltető MorphoLogic ügyvezetője.


A gépi fordításra világszerte egyre nagyobb az igény.

„Ha egy külföldi esetében megértőek vagyunk, amikor nem beszéli pontosan a nyelvünket, a géppel szemben miért nem mutatunk toleranciát?” – veszi védelmébe termékét Prószéky, miután az tesztünk során a „german investor sentiment rises” cikkcímet „a német befektető vélemény emelkedik” formulára fordította le. Az ügyvezető úgy véli, az efféle szoftvereknél nem a nyelvtani pontosság, sokkal inkább az érthetőség számít.

„A fordítóprogramok még messze nem szállítják a tökéletes megoldást” – ért egyet lapunk álláspontjával Dobos László, a szintén e területre specializálódott Dativus Translator Kft. vezető fejlesztője. Tapasztalatai szerint a jónak számító szoftverek is csak 70-80 százalékban dolgoznak pontos találati aránnyal. Hozzáteszi viszont, hogy a gépi fordítás, ha nem is képes kiváltani a tolmács munkáját, abban utat mutathat, hogy mely dokumentumokról érdemes részletes fordítást készíttetni. A megoldásnak a hivatásos fordítók is hasznát vehetik – a Dativus szoftvere például teljes körű szótárazást végez, a szóismétlés kivédésére pedig rokon értelmű szavakat ajánl fel. Prószéky ehhez azt teszi hozzá, hogy bizonyos területeken a fordítógépek teljesítménye már közelíti az emberét: a számítástechnikai szakkönyvek fordításában például kifejezetten jó eredménnyel küldhetők hadba.

Persze a fejlesztő cégeknek nincs könnyű dolguk, amikor a számítógéppel akarják megértetni az emberi nyelvet. Ennek során két fő csapásirány közül választhatnak: alkalmazhatják a nyelvi összefüggéseket megfogalmazó szabály alapú módszert, illetve a nagymennyiségű szöveg elemzésére építő statisztikai eljárást. Utóbbi megközelítés különösen az Egyesült Államokban népszerű. Ott ugyanis a fejlesztők azt mondják, könnyebb bizonyos nyelvekből nagy szövegmintákat begyűjteni, semmint azok nyelvtani szerkezetét részletesen kielemezni; erre a módszerre támaszkodik webfordítójában a Google is. A legjobb eredményeket azonban vélhetően a két módszer ötvözete adja; effélével próbálkozik a MorphoLogic és a Dativus is. Utóbbi például jelenleg egy 600 ezer mondatos szövegtestet használ (ez a későbbi verziókban bővíthető lesz), amit kiegészítenek a beprogramozott szabályok.

Mindenesetre a gépi fordításra világszerte egyre nagyobb az igény. Ebben az is közrejátszik, hogy robbanásszerűen megnőtt a létrejövő információk mennyisége, de vannak további okok is. Az Egyesült Államokban például a 2001. szeptember 11-e után megváltozott világhelyzet adott lökést a fejlesztéseknek, míg az EU-ban a bővítés sokszorozta meg a fordítás iránti igényt. Az unió összes nyelvpárja között fordító hibrid programrendszer létrehozását célzó brüsszeli projektnek a MorphoLogic is résztvevője. Prószéky Gábor cége ezzel párhuzamosan azon fáradozik, hogy fordítóoldaluk ne csak a Google találatait fordítsa magyarra, de a magyarul beírt keresőszavak alapján releváns angol nyelvű találatokat is adjon. A fejlesztés révén még nagyobb információtömeg válna elérhetővé az idegen nyelvekben gyengélkedő felhasználók számára.