A robotokkal folytatott intelligens párbeszéd – a tudományos-fantasztikus irodalom klasszikus témája – hamarosan egy lépéssel közelebb kerül a valósághoz a nemzetközi űrállomás asztronautái számára.
A kaliforniai Szilícium-völgyben működő NASA Ames Research Center és a Xerox Corporation egy sokoldalú, hangvezérelt számítógépes rendszert mutatott be a Michigani Egyetemen (Ann Arbor), ahol az Association for Computational Linguists szövetség 25. éves találkozóját tartotta.
A “Clarissa” nem csak érti a parancsokat, de figyelmeztet is
A Clarissa nevű rendszert az asztronauták munkaterhelésének csökkentésére fejlesztették ki.
„Clarissa egy teljesen hangvezérelt virtuális űrasszisztens, segítségével az asztronauták hatékonyabban használhatják kezüket és szemüket, és teljes figyelmüket a megoldandó feladatra összpontosíthatják, miközben beszédparancsokkal vezérlik a rendszert” – fejtette ki Beth Ann Hockey, az Ames kutatóközpontban dolgozó fejlesztői csapat projektvezetője.
A Clarissa felszabadítja az asztronauták kezét és reagál beszédparancsaikra; munka közben hangosan felolvassa nekik a folyamat lépéseit, segít számon tartani a már elvégzett lépéseket, valamint rugalmasan megadható, beszédaktivált riasztásokkal és időzítőkkel biztosítja, hogy semmiről se feledkezzenek el.
Az asztronautáknak manapság már mintegy 12 000 bonyolult műveletet kell elvégezniük a létfenntartó rendszerek működtetéséhez, az űrruhák megvizsgálásá-hoz, a tudományos kísérletek elvégzéséhez, az orvosi vizsgálatok végrehajtásához és más rutinfeladatok elvégzéséhez.
„Próbáljon csak meg elemezni egy vízmintát, miközben végignézi egy eljárás kézikönyvét a számítógép képernyőjén, és mindezt mikrogravitációs lebegés közben” – mondja Michael Fincke asztronauta, aki a nemzetközi űrállomáson eltöltött hat hónap után a közelmúltban tért vissza. „A Clarissa űrasszisztenst beszédparancsokkal irányíthatom, meghallgathatom az útmutató lépéseit, és közben a kezemmel elvégezhetek egy eljárást – ez akkora segítség, mint ha még egy csapattag lenne a fedélzeten”.
Mivel a rendszernek mindig készen kell állnia beszédparancsok fogadására, a virtuális asszisztens első változata megpróbált értelmezni minden kiejtett szót, még a csapat tagjainak egymás közötti beszélgetéseit is. Ennek eredményeként a Clarissa nehezen tudta megkülönböztetni a beszélgetéseket a neki adott parancsoktól.
A NASA Ames Kutatóközpontjában dolgozó Manny Rayner, a Clarissát megvalósító csapat vezetője 2004-ben megbeszélést folytatott a Xerox európai kutató-központjában tevékenykedő Jean-Michel Renders-szel az esetleges együttműködésről. Azt remélték, hogy a Xerox gépi tanulás, nyelvészet és szövegkategorizálás terén szerzett tapasztalata növelni fogja a rendszer pontosságát „mindent vevő mikrofon” üzemmódban.
Folyamatos rendelkezésre állás
„A NASA azt akarta, hogy a rendszer bármikor készen álljon a segítségre anélkül, hogy külön aktiválási parancsokat kéne adni neki” – magyarázta Renders. „Ezért nem lehetett az egyszerűbb Start Trek megoldást választani, ahol az űrhajósok a rendszer megkérdezése vagy egy parancs kimondása előtt egy bizonyos szót mondanak, például azt, hogy számítógép”. Meg kellett oldanunk, hogy a rendszer jobban meg tudja különböztetni a parancsokat a beszélgetéstől.”
A Renders által a NASA beszédfelismerési problémájára kidolgozott technológiát a Xerox is használja a nyomtatott vagy digitális dokumentumok kategorizálásának javítására. A Xerox Grenoble-ban dolgozó kutatói számos olyan élvonalbeli szoftver képességet fejlesztettek ki, amelyekkel a Xerox ügyfelei könnyebben kezelhetik a dokumentumtartalmakat.
A Xerox módszerével a Clarissa pontosabban tudja elemezni a kiejtett szavakat. Felismeri a szavakat, a mondatokat és a szavak összefüggéseit, és reagálni tud a különböző módokon megfogalmazott parancsokra. A rendszer megvizsgálja a mondat összes szavát, figyelembe veszi az egyes szavak helyes felismerésének megbízhatóságát, és bonyolult gépi tanulási algoritmussal súlyozza a különböző pozitív és negatív információkat. Ezáltal a rendszer sokkal jobban el tudja különíteni a neki szóló parancsokat a beszélgetésektől. Renders szerint a továbbfejlesztés eredményeként a rendszer hibaaránya a korábbihoz képest több mint 50%-kal javult.
Jelenleg 75 parancsra reagál
A Clarissa jelenleg mintegy 75 különböző parancsot ért, amelyek 260 körüli szóból álló szókészlettel fogalmazhatók meg. A csapat azt tervezi, hogy a jövőben tovább fogja növelni a parancsok számát és a szókészletet.
„Vannak eléggé egyszerű parancsok, mások azonban eléggé bonyolultak” – magyarázta Hockey. „Többnyire olyan parancsok hangzanak el, mint tovább vagy ťmenj a 8. lépésre. Előfordul azonban, hogy ilyesmit kell mondani: 10 óra 25-ös riasztást kikapcsolni vagy ťvisszakérdezéses ellenőrzés beállítása a 3-as – 14-es lépésekre.