Az már senkit nem lep meg, hogy a Photoshop segítségével tulajdonképpen olyan fényképeket és képeket lehet előállítani, amit csak akar az alkotó, hiszen ezt hosszú évek óta tapasztaljuk. De az Adobe műhelyében nem csupán a vizualizációval foglalkoznak, hanem a hangokat is kezelésbe vették, és ennek igencsak lenyűgöző eredménye lett.
Ebben nem az a fantasztikus, hogy ilyet még nem láttunk, hiszen manipulált hangfelvételekről nem most hall először a világ, ugyanakkor az a könnyedség, amivel mindez kivitelezhető, szemkápráztató. Az alábbi videón látható bemutatót, melyet a ZDNet tett közzé, az Adobe egyik fejlesztője, Zeyu Jin prezentálta az Adobe MAX konferencián San Diegóban, ahol megmutatta, hogy a Project VoCo névre hallgató fejlesztés jelenleg milyen fázisban van.
Mint látható, a hangfájl minden különösebb probléma nélkül, szöveges formában manipulálható úgy, hogy a szoftver képes megérteni és replikálni a beszélő hangját, illetve mondandóját, ráadásul akár 20 perces időtartamot is képes kezelni.
Amikor hangfelvételt készítünk, legyen az akár párbeszéd, akár alámondás, a résztvevők sokszor utólag szeretnének változtatást kérni, mert vagy hibáztak valahol, vagy kifelejtettek valamit, esetleg egyszerűen csak a narratíván kívánnak változtatni. Az általunk kifejlesztett technológia, a Project VoCo, melynek segítségével egyszerűen csak be kell gépelni a szót, vagy szavakat a cserélendők helyére, vagy beilleszteni a kommentárba. Az algoritmus a munka többi részét elvégzi, és a végeredmény olyan lesz, mintha a beszélő szájából hangzott volna el.
– írja az Adobe a sajtóközleményében. Mindebből jól látszik, hogy miután a képszerkesztésben új távlatokat nyitottak a felhasználók számára, most a hangok területén is hasonló cselekedetet kívánnak végrehajtani. Ugyanakkor érdemes mindennek az etikai hátterét is végiggondolni, hiszen így valóban olyan dolgokat mondathatunk ki emberekkel, amiket ők esetleg soha nem ejtenének ki a szájukon.