Tech

A legnagyobb zajban is képes kiszűrni az emberi beszédet a Google gépagya

Dömös Zsuzsanna
Dömös Zsuzsanna

újságíró. 2018. 04. 13. 15:02

Korábban a témában:

A gépek eddig nem voltak különösebben sikeresek abban, hogy különféle beszédhangokat szűrjenek ki nagyobb tömegben – elég csak arra gondolni, hogy mi történik akkor, ha valaki egy házibuli közepén, hangos zene közepette beszél egy virtuális asszisztenshez.

A Google ezen a problémán kíván javítani egy saját megoldásával: olyan mélytanulásos rendszert fejlesztettek, ami képes kiszűrni a beszédet a zajos környezetekben úgy, hogy közben az emberek szájáról is “olvas”. Egészen pontosan vizuális jeleket keres a beszélő arcán, gesztusokat, szájmozgásokat.

Az eredményt egy videón is megnézhetjük, amin két humorista beszélget a harsogó tömegben. A szoftver képes csak az egyik beszédét kiemelni olyan módon, hogy a férfi arcára összpontosít, a hangsávról pedig minden más zavaró hangot leválaszt. A feladatot akkor is sikeresen teljesíti, ha az előadó arca részben el van takarva saját kezével, vagy a mikrofonjával.

A Google a jövőben számos termékében tervezi az algoritmus felhasználását. A Hangouts és Duo nevű csetprogramokban például érthetőbbé válhatnának azok a csoportos beszélgetések, amelyekben a résztvevők zajos helyszíneken jelentkeznek be.

vissza a címlapra

Ajánlott videó mutasd mind

Szerdán lefagy az ország harmada

Kommentek

Demonstrtors gather outside the Parliament to protest against Brexit, waving EU and Union flags and a placard reading 'Brexit Is It Worth It?', London on September 12, 2018. Conservatives MPs opposed to Mrs May's Brexit Plan have met to discuss how and when they could force her to stand down as Prime Minister. (Photo by Alberto Pezzali/NurPhoto)
Nézd meg a legfrissebb cikkeinket a címlapon!
24-logo

Engedélyezi, hogy a 24.hu értesítéseket
küldjön Önnek a kiemelt hírekről?
Az értesítések bármikor kikapcsolhatók
a böngésző beállításaiban.