Korábban az épülő kínai digitális diktatúra kapcsán írtunk róla, hogy manapság egyre több helyen figyelik meg az emberek érzelmeit a technológia segítségével, az erre irányuló fejlesztések gyors ütemben haladnak. A Kínában elhelyezett, mesterséges intelligenciával felvértezett térfigyelő-kamerák hét perc alatt bárkit megtalálnak, de szoftvereket vetnek be bűnmegelőzési céllal is, hogy arckifejezések és viselkedés alapján még elkövetés előtt felismerhessék az ártó szándékot.
Az önvezető autók kapcsán is folynak olyan fejlesztések, amik a jövőben lehetővé tennék, hogy a jármű szoftvere felismerje, ha az utasok pánikolnak, lehangoltak, és átvegyék az irányítást az autó felett.
De elég akár a nappalikba bekukkantani: az Amazon Alexa nevű virtuális asszisztense például képes felismerni az emberi beszéd különféle tónusait, hangsúlyait, ezáltal pedig pontosabban meghatározni a felhasználó parancsait és szándékát.
Egyre többen dolgoznak azon, hogy az algoritmusok fel tudják ismerni az emberi érzelmeket, a mesterséges intelligencia témakörébe tartozó érzelmi számítások egy külön kutatási területet képeznek már az informatikán belül, ez az affective computing. Noha a terület viszonylag fiatal, és számos kihívás elé állítja a szakembereket, sokszor fontos felismerésekre vezet rá emberi működésünkkel kapcsolatban.
Dr. Rich Firth-Godbehere érzelmekkel foglalkozó kutató, történész szerint az érzelemfelismerő szoftverek egy komoly veszélyt is hordoznak magukban. Azért hibázhatnak a jövőben, mert
Szakértői körökben egy ideje folyik vita arról, hogy a régi modellek idejétmúltak azzal kapcsolatban, hogy hat alapvető emberi érzelem létezik, és ezeket a világ minden táján ugyanúgy fejezzük ki, mert biológiailag ez van belénk kódolva. A szoftverekkel ez olyan módon függ össze, hogy a szenzorok által érzékelt arckifejezések, vizuális jelek, hanghordozás alapján kategorizálnak, de mivel az emóciók félreérthetők lehetnek, nehéz őket mérni.
Gyászoló fiú akarta megváltoztatni a világot
A hat alapérzelmet Paul Ekman határozta meg, akinek modelljére Charles Darwin, az evolúciós elmélet szülőatyja is hatást gyakorolt. Öröm, bánat, düh, meglepődés, félelem és undor – ez az a hat emberi alapérzelem, amit Ekman szerint arcmimika alapján a világ bármely táján felismernek az emberek.
Az 1934-ben született Paul Ekman édesanyja depresszió miatt öngyilkos lett, a fiú pedig arra tette fel életét, hogy feltérképezze az emberi elme titkait, doktori disszertációját is a depressziós emberekről írta. Főleg a nonverbális kommunikáció, a testbeszéd és a kézmozdulatok érdekelték, és azzal a megközelítéssel dolgozott, hogy nem az abnormális, hanem a normális viselkedést kell alaposabban vizsgálni. Ennek kapcsán jutott el odáig, hogy megkeresse az alapvető, közös emberi érzelmek eredetét.
A hatvanas években Margaret Mead kultúrantropológus is jelentős felfedezéseket tett, ő azt vizsgálta, mennyire különbözően fejezik ki érzelmeiket az eltérő kultúrák, és hogy az érzelmeket nem univerzálisan, nem egyformán fejezzük ki. Mead arra talált bizonyítékot, hogy az érzelmek és más szociális jelenségek kulturálisan konstruáltak, az arckifejezések erősen kultúrafüggőek. Ekman ezzel nem értett egyet, ő inkább Darwin azon elképzelését osztotta, hogy az emberek univerzális érzelmeket fejlesztettek ki, és ezek az evolúciós múlt jeleiként maradtak az ember viselkedésrepertoárjában.
1964-ben Ekman gondban volt, mert az érzelmek tanulmányozásához először azokat pontosan meg is kellett határoznia. Így elkezdte kutatni, hogy az arckifejezések milyen módon függnek össze az érzelmekkel. Ez alapján hat olyan alapvető emóciót határozott meg, amik a világ minden táján élő embereket jellemzi:
Az addigi kutatások során viszont gondot okozott, hogy a tesztalanyok mindegyike fogyasztott már valamilyen formában nyugati médiát, akár fotók, filmek, tévéműsorok formájában és találkozhattak azzal, hogy miként jelenítenek meg érzelmeket a művészek. Annak bizonyítására, hogy az érzelmek kifejezése biológiailag van belénk kódolva, kultúrközi kutatásokra, és olyan emberekhez volt szükségük, akik elszigetelődve éltek és nem érintkeztek a külvilággal.
Az új-guineai írástudatlan fore néppel végzett kísérletében a résztvevőknek valamilyen érzelmi töltetű történetet mesélt, majd arra kérte őket, hogy három fénykép közül, amelyeken különböző érzelmeket kifejező amerikai arcok voltak, válasszák ki azt, amelyik legjobban illik a történethez. Bár még soha nem találkoztak nyugati emberekkel, mégis magas százalékban ki tudták választani a megfelelő arckifejezést. Ez igazolta azt, hogy alapérzelmeink egyetemesen jelen vannak, kultúrától függetlenül.
Ennél összetettebbek vagyunk
Ekman érzelemmodellje végül bekúszott a popkultúrába is: a mikro-arckifejezések ismeretére tanította nemcsak a nyomozókat, de még a Pixar animációs stúdiónak is beszélt arról, mitől lehetnek kifejezőbbek a mesekarakterek arcai. Tanácsadóként vett részt a Lie To Me című sorozatban, amely azzal foglalkozott, hogyan lehet a hazudozókat testbeszéd alapján lebuktatni.
A fejlesztők pedig idő közben elkezdték fejleszteni algoritmusaikat, Ekman hetvenes években kidolgozott arctevékenység-kódoló rendszere ( Facial Action Coding System, FACS) alapján. A rendszer megalkotása során feltérképezték az arc 23 pár izmát, és az azokhoz kapcsolódó mozgásokat. Ezen apró mozgások elemzésével állapítja meg a rendszer, hogy a személy éppen milyen érzelmi állapotban van.
Ennek használatba vételekor azonban egyre több kutató úgy tapasztalta, hogy valami nem működik. 2015-ben Glasgow-i Egyetemen arra jutottak a kutatók, hogy valójában csak négy alapvető érzelem van – a félelem és a meglepődöttség nagyon hasonlít egymásra, ahogy a düh és az undor is. A világháló atyjaként ismert Sir Tim Berners-Lee nevével fémjelzett WWW konzorcium az érzelmi állapotok meghatározására alkalmas nyelven dolgozik, de ők is szakítottak az Ekman-féle csoportosítással, helyette egy 24-es érzelmi skálát tekintenek alapnak. Jelenleg úgy tűnik, hogy nincs releváns szám az érzelmek számát illetően.
Napjainkra már ott tartunk, hogy érzelemfelismerő mesterséges intelligenciát használnak a reptereken, rendőrségeken, a Firth-Godbehere cikkében megfogalmazott kritika szerint viszont minden rendszer problémába ütközött, amint szűk tesztkörből nagyobb mintán kezdték el alkalmazni. Ennek oka, hogy nem hat univerzális érzelem van, Ekman elképzelése több ponton is elcsúszik.
Mégsem ismerjük magunkat annyira?
Az első, hogy még mindig nincs olyan definíciója az érzelemnek, amivel mindenki egyetértene, az elmúlt ötven évben minden jelentősebb szaklap saját verziót használt. Maga az „érzelem” kifejezés is csak a 19. század óta használatos az angol nyelvben, így viszonylag új kifejezésnek számít. Előtte alkategóriákat használtak inkább, és sok szakértő szerint nem lehet valamit kategorizálni, ha maga a kifejezés is viszonylag fiatal és nincs rá egyezményes definíció.
A fore népen végzett kísérlettel kapcsolatban is több kritika fogalmazódott meg, amelyek miatt nem tartják hitelesnek azt. A kritikusok szerint nem is Ekmanék lehetettek az első emberek, akik találkoztak a lakosokkal, mivel azok nem voltak teljesen izolálva az európaiaktól. Történhettek félrefordítások a lakosokkal való kommunikáció során is. A készült fotókkal kapcsolatban pedig többen azért szkeptikusak, mert szerintük azon természetellenesen túlzó arckifejezések láthatók.
James Russel pszichológus és kutatócsoportja által végzett friss tanulmány azt mutatta, hogy amikor csecsemőknek realisztikus arcokat mutattak fényképeken, nyolcéves korukig nem voltak képesek felismerni az azokon látható érzelmeket. A kicsik nem tudták, hogy egy undorodó arc undort fejez ki. Egy másik kutatás során arra jutott Lisa Felmand Barrett és csapata, hogy kultúránként más csoportba sorolhatják az alanyok az arckifejezéseket. Az algoritmusoknak viszont nincs kultúrájuk.
Russel friss tanulmánya szerint ugyan míg mindannyian érzünk hasonló dolgokat, számos más faktor is szerepet játszik egy érzelem kialakulásában. Például az, hogy milyen neveltetést kaptunk, hogy megértsük azokat, a nyelv, amivel leírjuk, a korábbi kapcsolódó szituációk, emlékek és más elemek – mindez nem csökkenthető le csupán egy érzelemre és arcra.
Mi ezzel a gond a jövőre nézve?
Technológiai szempontból az a baj az elavult elméletekkel Godbehere szerint, hogy ha az algoritmusok az érzelmek univerzális, leíró kifejezésektől eltérő arckifejezéseket látnak, azokat nem tolerálják, másrészt pedig a gépek is tévedhetnek. Ha a világszerte, kultúránként másként megjelenő érzelmeket leegyszerűsítik, azzal csökkentik a kifejezések gazdagságát, a szoftverek tévesen olvashatnak le érzelmeket emberekről, ezért míg magunkat sem ismerjük megfelelően, nem szabad algoritmusokra és szoftverekre bízni, hogy megítéljék azt, mit érez a sofőr, vagy hogy ki készülhet bűncselekményre.
A pszichológus főleg attól tart, hogy ennek hozományaként a bűnözők
de az algoritmus azok mimikáját is félreértelmezheti, akik ártatlanok.
Még maga Paul Ekman sem bízik a gépekben. Szerinte az érzelemfelismerő algoritmusok nem lesznek képesek értelmezni például azt, ha valaki összeszorítja az ajkait, mert az kultúrától és helyzettől függően más dolgokat jelenthet. Ő is attól fél, hogy az emberek idővel megtanulnák kontrollálni arckifejezéseiket.