Tech

Ezt tudjuk eddig a TikTok „mágikus” algoritmusáról

Tolga Akmen / AFP
Tolga Akmen / AFP
Sokszor emlegetik mostanság a TikTok kapcsán, hogy jobban ismer, mint mi magunkat, de a valóság ennél árnyaltabb. Egy nemrég kiszivárgott belsős dokumentumnak köszönhetően már sokkal többet tudunk arról, hogyan is válogat tartalmakat a videós alkalmazás mögött álló algoritmus.

Sokszor olvasni a fordulatot, hogy az algoritmusok jobban ismernek minket, mint mi magunkat. Most már nemcsak azt becsülik meg nagy pontossággal, hogy mikor fogunk felmondani a munkahelyünkön, de egy ezerszavas írásunkból a hozzávetőleges életkorunkat is meghatározzák. A közelmúltban nagyon hamar az érdeklődés középpontjába került a TikTok mögött dolgozó kód is, mivel a videós app más megközelítéssel használja a felhasználók adatait, mint a Facebook, mégis úgy tűnik, hogy ezt elképesztő pontossággal teszi. A Mashable szerzője, Jess Joho egyenesen úgy fogalmazott cikkében: „a TikTok úgy olvas a lelkedben, mint egy digitális orákulum, és lehámozza a még magad előtt is rejtett rétegeket”. Ezt arra alapozza, hogy szerinte a videós app előbb tudta, hogy biszexuális, minthogy ő bevallotta saját magának.

Mint mindennek, az ajánlórendszereknek is megvannak a maguk árnyoldalai. Egyeseket teljesen behúznak például a teljesen ártalmatlan kertészkedős videók, mások meg töménytelen mennyiségben kapnak ajánlásokat ADHD-val, Tourette-szindrómával, autizmussal, vagy mentális betegségekkel kapcsolatos tartalmakról. Inna Kanevsky pszichológus professzor szerint kockázatot jelent, hogy az ajánlások alapján a netezők saját magukat diagnosztizálhatják valamilyen mentális problémával, pusztán mert tudnak azonosulni egyes kreatív videókkal. Ahogy a szakember rávilágít:

nem szabad kiszervezni az önismereti munkát egy algoritmusnak.

Persze ahogy a konkurens szolgáltatások mögött álló kód, úgy a TikTok algoritmusa is lépéseket ismételget, folyamatosan tanul és finomodik a bevitt adatok alapján. Amikor valaki frissen regisztrál egy fiókot, az algoritmus a legnépszerűbb videókat mutatja neki számos témában, kezdve a táncos kihívásoktól a főzős videókig, amivel valójában teszteli, milyen reakciót ad rá a néző – fedte fel a Wall Street Journal egy videóban. A lap száznál is több robotfiókot lendített támadásba a platformon, az ajánlórendszer pedig kevesebb mint két óra alatt ráérzett a robotok előre beprogramozott érdeklődési körére.

A kulcsszó: a figyelem

Ugyan a TikTok rámutathat olyan dolgokra, amiket a felhasználók nem vesznek észre magukon, de pontosabb lenne azt mondani, hogy a TikTok azt mutatja meg, mire figyelünk leginkább. Azért is pontosabb ez a kifejezés, mert természetesen a TikTok célja a profitszerzés, ami a figyelem révén valósul meg.

A TikTok négy fő faktort vesz figyelembe: „felhasználói értéket”, a „hosszú távú felhasználói értéket”, az „alkotói értéket”, és a „platform értéket”. Mindez egy belsős dokumentumból derül ki, ami azt próbálja bemutatni alkalmazottaknak, milyen logika mentén működik a termék – elemezte ki az írást a New York Times, amelyhez a lap egyik szerzője jutott hozzá. A „TikTok Algo 101” című dokumentumot a TikTok egyik mérnöke készítette el Pekingben, és azóta a cég szóvivője is megerősítette a hitelességét. A dokumentáció eddig nem látott részletességgel enged betekintést a videós alkalmazás működésébe. Ahogy a portál kiemeli: a most már havi egymilliárd aktív felhasználóval bíró TikTok pont ott teljesít jól, ahol a többi konkurens alkalmazás nem. Egyrészt pofonegyszerű vele a videószerkesztés, másrészt akik nem alkotnak, csak fogyasztanak, rendkívül személyreszabottan kapják a rövid videókat.

A TikTok korábban nyilvánosan csak annyit mondott, hogy az ajánlórendszer számításba veszi a lájkok és kommentek számát is, ahogy a videók hashtagjeit, zenéit is. A Wall Street Journal elemzése szerint

a legfontosabb tényező az, hogy a felhasználó mennyi ideig néz egy videót, mielőbb továbbgörget egy másikra.

Ez pedig a fiatal nézőket a nyúl üregébe rángathatja, főleg az önbántalmazásra és öngyilkosságra buzdító tartalmak esetében. Bár ezeket a TikTok folyamatosan monitorozza és távolítja el a felületéről, továbbra is nagy problémát jelentenek.

A dokumentum tisztán kifejti, hogy a cég fő célkitűzése a felhasználói bázis növelésében, hogy két mutatót optimalizáljon a videók ajánlásakor: az egyik a megtartás, azaz hogy a felhasználó többször is visszajöjjön, a másik, hogy minél több időt töltsön a kijelző előtt. Az alkalmazás értelemszerűen a lehető legtöbb ideig szeretné behúzni a netezőt. A rendszerben a kijelző előtt töltött idő a kulcs, ez nem meglepő, hiszen így működnek más közösségi szolgáltatások is. Az algoritmusok függővé próbálják tenni az embereket, ahelyett, hogy azt adnák nekik, amit valójában szeretnének – mondja Guillaume Chaslot az Algo Transparency csoport alapítója, akik korábban a YouTube ajánlórendszerét és a gyerekekre gyakorolt hatásokat tanulmányozták. „Minden videó, amit megnéz a gyerekünk, egy újabb információdarab a TikTok számára. Pár órán belül az algoritmus már érteni fogja a zenei ízlését, hogy milyen külső jegyek tetszenek neki, mikor depressziós, azt is, ha netalán drogozik, és sok más érzékeny dolgot. Nagy a kockázata annak, hogy ezek az információk akár ellene fordíthatók, mivel még pontosabb célzással még inkább függője lehet a platformnak”.

Rafael Henrique / SOPA Images / LightRocket / Getty Images

A dokumentum szerint az érdeklődési körön belül is a jobb minőségű videókat dobja fel a rengeteg tartalom közül. Az ajánlórendszer minden videónak ad egy értéket, amit a saját kidolgozott egyenlete alapján állapít meg, és azok közül is a legmagasabb értékűt fogja a felhasználó elé dobni. Ezzel az egyenlettel előzik meg egyébként azt is, hogy ne a sokat lájkolt videók kerüljenek előtérbe, mivel a lájkok számát mesterségesen is lehet duzzasztani. Egyes tiktokkerek olyan kulturális utalásokat rejthetnek el a videóikban, amik a többi videójuk megnézésével érthetők meg jobban, ezért például a felhasználó által az összes videó megtekintésének összértéke magasabb, mint az egyes videók megtekintésének összesített értéke – mutat rá a dokumentum az összefüggésre.

Persze ennek kapcsán felmerül a szűrőbuborék problémája is. Ha a felhasználónak megtetszik egy bizonyos típusú videó, de az app továbbra is csak ahhoz hasonlót ajánl neki, akkor ő nagyon gyorsan rá fog unni a dologra, és kevesebbet használja az alkalmazást. A TikTok ezen is csavar egyet, és valamennyire tágítja azt a buborékot – ugyan az érdeklődési körbe illő videókat ajánl főleg, de nem kizárólag azokat. Ez pedig valójában mindkét oldalnak jó: az újabb tematikák behozásával az algoritmus még többet tud meg a felhasználóról és reakcióiról.

Julian McAuley, a California San Diego Egyetem professzora szintén elemezte a leírást, és meglátása szerint az algoritmus működése viszonylag hagyományos, jól bevált módszert követ. A vállalat előnye viszont, hogy a gépi tanulást elképesztő mennyiségű adattal ötvözi, és nincs mögötte semmi különösebb varázslat, hiába kapta fel a média a TikTokot, mint valami mágikus tudás birtokában lévő közösségi platformot. A dokumentum tehát meglehetősen sokat segít az algoritmus működésének megértésben, amit a techcégek rendszerint szeretnek túlmisztifikálni, és úgy előadni, mint amit a kritikusok és a szabályozószervek úgyse értenének meg. Igaz, a használt modellek összetettek lehetnek, de az alapelvek és a logika teljesen érthető, és nagyban hasonlít ahhoz, amit a többi közösségi oldalnál is látni.

Az adatkezelés már más tészta

A kínai eredetű alkalmazás természetesen kivívta az Egyesült Államok ellenszenvét is. A volt republikánus elnök, Donald Trump 2020 augusztusban megpróbálta betiltatni az appot, arra hivatkozva, hogy a Kínai Kommunista Párt a TikTokon keresztül gyűjt adatot az amerikai felhasználókról. Ez végül a bíróságon nem állta meg a helyét, az elnökválasztás után pedig feledésbe is merült ügy. Biden visszavonta a rendeletet, de a saját kormánya továbbra is vizsgálja a TikTok gyakorlatait.  A Tiktok persze továbbra is azt kommunikálja hivatalos közleményeiben, hogy sosem adott ki adatot a kínai kormánynak kérésre sem. A kínaiak végül úgy próbálják csillapítani a kedélyeket, hogy az amerikaiak felhasználói adatait az Egyesült Államokban tárolják, Szingapúrban pedig biztonsági másolatok vannak.

Egy másik jelentős problémakör, hogy a TikTok hogyan cenzúrázza (ha cenzúrázza) a politikailag érzékeny bejegyzéseket, illetve hogy alkalmas-e propaganda terjesztésére. A kérdés azután vált kiemeltté, hogy a TikTok moderátorai korábban töröltek egy videót, melynek készítője a Kínában elnyomott ujgurok mellett állt ki. A cég erre reagálva már teljesen megtűri a platformon azokat a tartalmakat, amik a Kínai Kommunista Párttal szemben fogalmaznak meg kritikát, de a gyanú szerint visszafogják az eléréseket.

A Citizen Lab, a torontói kiberbiztonsági megfigyelő szervezet idei jelentése szerint egyelőre nincs sok bizonyíték az állítás alátámasztására: nem talált arra utaló jelet, hogy a TikTok érzékeny témákat cenzúrázott volna, vagy adatokat továbbított volna Kínába. Egyelőre sajnos nincs független módszer annak megállapítására sem, hogy a cég elnyomja-e a kereséseket az ilyen tartalmakra, és a hozzájuk kapcsolódó hashtagekre. Még a Twitter és az Instagram esetében is nagy különbségek vannak ilyen téren, mert egyes keresések a Twitteren sokkal jobban pörögnek, mint mondjuk az Instagramon.

Ajánlott videó

Olvasói sztorik