A kimondott szóról kimondott szóra fordító programok már jó ideje léteznek, ez egyáltalán nem újdonság – viszont úgy működnek, hogy az egyik fél által kimondott szavakat írásba foglalják, majd ezt az írást fordítják, és mondatják ki a géppel. A Google-nak most sikerült a középső lépést teljesen kihagyni: a Translatotron kimondott szóról kimondott szóra fordít, mindenféle köztes szöveg nélkül.
A hagyományos módszer első útját “beszédből szöveg” kifejezéssel szokták megnevezni (speech-to-text, STT), ezután következik a gépi fordítás, majd a “szövegből beszéd” (text-to-speech, TTS). Tapasztalatok alapján ez elég jól működik, de nem hibátlan, hiszen
Ráadásul az is biztos, hogy a többnyelvű emberek a saját fejükben sem így fordítanak, a gépeknek pedig az volna a leghatásosabb, ha ezt a folyamatot tudnák lemásolni. Ezért tanítják őket az emberi kognitív folyamatok alapján. A többnyelvű emberek fordítófolyamatát egészen pontosan nem értjük, de biztosan nem úgy néz ki, hogy az egyik nyelven elhangzott mondatokat lebontják, vizualizálják a szöveget másik nyelven, majd ezt mondják ki – pedig a jelenlegi fordítóprogramok pontosan ezt teszik.
A Translatotron alapja az, hogy a kutatók nem szöveget, hanem a hanghullámokat próbálják meg egyik nyelvről a másikra átfordítani. Ez lényegesen más, mint a korábbi változat, és megvannak a saját hibaveszélyei, viszont az előnyei is óriásiak. Az egyik például az, hogy a metódus gyorsabban működik a korábbi megoldásoknál, hiszen kevesebb lépésből áll, a másik pedig az, hogy az eredmény nemcsak egy robothangon felolvasott mondat lesz, hiszen a hanghullámokból a hanglejtést és a hangsúlyozást is ki lehet olvasni.
A Google új módszere persze még mindig csak tesztüzemmódban fut, és egyelőre nem tökéletes, de a kutatók szerint már szépen használható. Ha kíváncsi arra, mi jön ki most a fordítóprogramból spanyol-angol nyelveken, akkor kattintson ide.