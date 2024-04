Amióta 2022 novemberében széles körben elérhetővé vált a ChatGPT, gombamód nőnek ki a technológiai vállalatok a földből, amelyek így vagy úgy, de generatív mesterséges intelligenciát használnak a felhasználók elcsábítására. Míg a fent említett szoftver csak szöveg generálására képes, az alapjául szolgáló nyelvi modellt használják már grafikai célokra (DALL-E), valamint videók készítésére is (Sora). És itt még csak az OpenAI fejlesztéseiről beszélünk, a Google és a Meta alkalmazásai még fel sem merültek.

Most pedig megérkezett az első, valóban kompetens zeneszámokat készítő felület, a Suno AI, ami néhány szó megadását követően olyan számot generál, amilyet csak akarunk. Akár magyar nyelven is.

Ahogy a fent említett elődöknél, így itt is felmerül a kérdés:

hogyan lehet kordában tartani egy ilyen technológiát,

mik a jogi keretei a program képzésének,

és egyáltalán mit szólnak hozzá a szakma képviselői: nem féltik-e a megélhetésüket, a zenei jogaikat és a kreatív szabadságukat a mesterséges intelligenciától.

Cikkünkben ezeket a kérdéseket járjuk körbe a hazai zenei jogvédelmi egyesület, az Artisjus üzleti transzformációs igazgatójával, Tóth Péter Benjaminnal, illetve a Wellhello frontemberével, Karácson Tamással, vagyis Fluorral.

Hogy működik ez az egész?

A Suno egy olyan zenei mesterséges intelligencia, ami szöveges parancs, úgynevezett prompt alapján képes dalt készíteni egyedi szöveggel és alappal. A haladóbb alkotók azonban azt is megtehetik, hogy saját dalszöveget injektálnak a programba, amihez az MI generál zenei alapot. A cég társalapítója, Mikey Suleyman a Rolling Stone-nak adott interjújában kiemelte, a Suno saját mesterségesintelligencia-modellt használ a zene generálásához, a dalszövegek és a címadás terén pedig a ChatGPT-re támaszkodik.

Március közepe óta a Suno már egy fejlettebb, úgynevezett V3-as modellje is ingyen hozzáférhető, ami a GPT-4 nyelvi modellt használja. A fejlődés pedig valóban minőségi a V2 és a V3 között: míg korábban nagyrészt tükörfordításban volt csak képes magyar dalszövegeket készíteni, az új verzió már egész kompetens sorokkal áll elő.

Ezt jól szemlélteti az alábbi videó, amiben a Suno kérésemre kreált zenéje szól, a 24.hu magyar nyelvű himnusza, folk rock stílusban.

24.hu, a hírszolgálat széles körben Hírek, információk, minden, ami kell mostan’ Olvasom a címlapot, izgalom kezd támadni Végigszaladok a cikkeken, nem tudok megállni (oh-yeah) Refrén: 24.hu, ahol minden választ kapok (kapok) Minden hírt és sztorit és érdekes híreket lapozok (lapozok) 24.hu, találkozom a világgal (világgal) A híradóból mámorba esek (oh-yeah) Politika, kultúra, sport és tech világ 24 órából friss hírek, minden fontos ügy Egy perc alatt kiderül, mi történt a nagyvilágban Bennem a tudás, öröm és vágy (oh-yeah)

Természetesen a korábbi generatív mesterséges intelligenciákhoz hasonlóan itt is vannak megkötések. Míg a legtöbb képgeneráló szoftvernél nem lehet közéleti személyiségekről illusztrációt kérni, ezzel itt nincs gond, ha úgy tartja kedvünk akár Orbán Viktor politikájáról szóló rapdalt is készíttethetünk az alkalmazással.

Különböző előadókat azonban nem írhatunk a promptba, ami esetemben azt eredményezte, hogy amikor a sokak által kedvelt Avatar: The Last Airbender animációs sorozatról akartam dalt készíteni, trükkösen kellett fogalmaznom, a szoftver ugyanis először azt hitte, hogy az azonos nevű metálzenekar stílusát akarom lekoppintani.

Az alig egy tucat alkalmazottat foglalkoztató Suno célja, hogy több milliárd embert érjen el, akik, bár érdeklődnek a zenekészítés iránt, tehetségük nincs hozzá, így demokratizálható a zenei alkotás élménye.

Ezt napi tíz dalig ingyen is megtehetjük, ha viszont ennél komolyabb terveink vannak, akkor a zsebünkbe kell nyúlni. A havi 500 dal megalkotásához és több lehetséges variációhoz havi 8 dollárt (nagyjából 3000 forintot), 200 dalhoz, több opcióhoz és egyebekhez pedig már 24 dollárt (8700 forintot) kell kicsengetni. A fizetős csomagokhoz azonban a dalokhoz fűződő jogokat is hosszácsapja a cég, így – ha fizetünk, és később eladjuk a dalokat – akár még kereshetünk is az egészen.

Itt persze felmerül az a kérdés, amire az Egyesült Államoktól Európán át Ázsiáig keresik a választ, vagyis milyen jogaink lehetnek egy mesterséges intelligencia által generált alkotás kapcsán. Erről kérdeztük az Artisjus üzleti transzformációs igazgatóját, Tóth Péter Benjamint.

Ingoványos talaj

A szakértő szerint a mesterséges intelligencia kapcsán, de főleg az az által létrehozott művek jogi vonatkozásairól egyelőre nagyon nehéz bármi biztosat mondani. Az Európai Parlament ugyan március közepén elfogadta a történelmi jelentőségű AI Actet, annak végső formája csak májusra várható, és akár három év is eltelhet, mire érvényesülhet a gyakorlatban is. Ráadásul a hazai zenészek jogait kezelő Artisjus szerint rengeteg kérdést nyitva hagyott a törvény. Tóth Péter Benjamin közölte, az csupán az egyik megközelítés, hogy mekkora veszélyt jelent a mesterséges intelligencia az alkotókra, emellett vannak még más fontos kérdések is, amelyekre szintén választ kell találni. Ide tartozik

az előadó hangjához és képmásához kapcsolódó kérdéskör,

az is, hogy milyen zenéken tanítják be az MI-t.

Fontos továbbá, hogy azon tartalmak, amik elkészülnek, milyen jogi védelem alatt állnak, tehát lehet-e ugyanannyira védett, mint az ember által készített tartalmak.

Végül pedig: kit terhel ezek miatt az esetleges jogi felelősség.

A szakértő szerint a jelenlegi jogi szabályozás az úgynevezett szöveg- és adatbányászatra vonatkozó uniós törvényt veszi alapul. Ez arról szól, hogy szöveg- és adatbányászati célra fel lehet használni műveket, kivéve, ha annak a jogosultja tiltakozik ellene. Márpedig az Artisjus a magyar szerzők nevében tiltakozott – ez a szakértő szerint lehetővé teszi, hogy később képesek legyenek jogosítani az ilyen betanítási célú felhasználást. Az Artisjus mellett a francia jogkezelő is hasonlóan tett.

Ha tehát mégis kiderül, hogy valaki ezen tanítja be a szoftverét, az ellen fel lehet lépni. Mint Tóth Péter Benjamin elmondta, amennyiben egy cég szeretné felhasználni a magyar repertoárt, ahhoz engedélyt kell kérni, és akkor az Artisjus lincenszelni tudja a kért tartalmakat. Érdemi tárgyalások egyelőre nincsenek, de a jogi alapok adottak.

A tiltakozást az Artisjus tavaly tette közzé, azonban Tóth lapunknak elmondta, bizonytalan, hol kell publikálni egy ilyen felhívást, ahogy az is, mely művekre vonatkozik ez pontosan. Még formálódnak a jogi alapelvek, és nagyon hiányoznak az első jogszabályok, jogi ítéletek, amelyek bizonyára az nagy cégek között dőlnek majd el, mint amilyen például az Universal és a TikTok között zajlik. Lapunk kérdésére a szakértő hozzátette, a tiltakozás visszamenőleges hatállyal nem bír, így egyelőre nem úgy tűnik, mintha megtilthatnák a zenei művek használatát az MI képzéséhez.

Mint említettük, az is fontos kérdés, hogy az újonnan, mesterséges intelligencia segítségével létrehozott művek védettek-e. Tóth szerint a promptolás fontos kérdés, ugyanis ez azt jelzi, hogy megmarad az emberi közbenjárás, tehát az MI lényegében puszta eszköznek minősül, a kész mű pedig a szerző alkotása maradhat. A teljesen generált tartalmakra viszont ez nem igaz: ahol nincs emberi beavatkozás, legyen az akár egy párszavas parancs, ott szerzői jogi védelemről nem lehet beszélni.

Zenei alapjövedelem?

Abban a legtöbb szaklap egyetért, hogy a streamingfelületek megjelenéséhez hasonlóan a mesterséges intelligencia térnyerése is igen komoly átalakulást eredményezhet az iparágon belül. Egy nemrégiben készült kutatás szerint 5 éven belül a zenészek bevételeinek 27 százalékát veszélyeztetheti az MI, így elengedhetetlen, hogy mind a kiadók, mind a kormányok lépjenek az ügyben.

Tóth Péter Benjamin szerint jelenleg két megközelítés látszik. Az egyik, hogy a betanításhoz kell valamiféle engedélyezést kötni, melynek eredményeként jogdíj keletkezhet. A másik, hogy az üreshordozó-díjhoz hasonlóan – ez egy olyan jogdíjátalány, amit a magáncélú másolásra alkalmas adathordozókra vetnek ki – egy általánydíjat lehetne fizetni, ha valaki MI által generált anyagot használ.

Tóth szerint ez még csak ötletszinten merült fel, de jól mutatja, hogy nem engedélyezhet mindent a kiadó vagy az előadó, és el fog jönni egy pont, amikor már nem lehet visszatuszkolni a szellemet a palackba. Ez esetben tehát a jogdíjfizetés jelentheti a megoldást.

A szakértő szerint azonban

még közelében sem vagyunk annak, hogy a zenészek közötti eloszlás mértékéről beszéljünk.

A szerzői jog kapcsán felmerült egy potenciális megoldás, amit az EU-ban már most is használnak, igaz, leginkább a műkincsek kapcsán. Ez a fizető közkincs, aminek lényege, hogy amennyiben egy, még szerzői jogi védelem alatt álló műtárgyat eladnak egy aukciós házban, abból részesedést kap a szerző vagy adott esetben a jogutód.

Ez főleg olyankor hasznos, ha egy festő korábban olcsón adta el a művét, ám egy idő után megnő a mű értéke. Ez a kezdeményezés mára ott tart, hogy a szerzői jogi védelem lejárta után is jár egy díj, amiből azonban már nem a szerző vagy a jogutód, hanem a most alkotó művészek részesülnek. Ennek mintájára lehet elképzelni valamiféle díjazást a zenészek részére is.

Mit gondolnak erről a zenészek?

Mint azt az Artisjus szakembere elmondta, tavaly a dalszerzők napján is a mesterséges intelligencia volt a fókuszban, és készítettek egy-egy felmérést a zenészek és a közönség körében. A zenészek közül a válaszadók kétharmada azt mondta, magához a zenei alkotáshoz nem, de kiegészítő tevékenységekhez, például utómunkához, plakátokhoz, albumborítóhoz szívesen használnának mesterséges intelligenciát.

Karácson Tamás, vagyis Fluor lapunknak elmondta, próbálgatás szintjén ők is használtak már mesterséges intelligenciát, például, amikor arra voltak kíváncsiak, hogyan szólna az adott dal női vokállal. Ehhez már elég fejlett plug-inek állnak rendelkezésre, így alkotótársa, Diaz képes volt Billie Eilish hangján megszólalni a stúdióban. Ez azonban csak arra volt jó, hogy teszteljenek, az éles felvételhez valódi női énekest hívtak.

Fluor szerint néhány hónapja, amikor megjelent a virálissá vált Azahriah x Szoboszlai dal, sokan azt gondolták, hogy csak be kell írni valamit, és az MI elvégzi a munkát a zenészek helyett. Ez viszont szerinte ebben a formában nem igaz, ugyanis Diaznak tökéletes hangszínben kellett felénekelnie az adott részt ahhoz, hogy az MI neki tudjon látni a munkának. Elmondása szerint egyelőre nehéz mit kezdeni az MI kérdésével, de azért nem zárkóznak el teljes mértékben.

Úgy nem használnánk dalban, hogy az teljes egészében AI által generált. Morálisan nem tudnánk mögé állni, a magam részéről alapvetően inkább ellenzem az AI által generált dalszerzést, mint nem. Úgy gondolom, hogy egy ilyen folyamatnak személyesebbnek kell lennie. Az őszinteségről alkotott képemmel megy szembe, ha a mesterséges intelligencia írja a dalszöveget.

Mint mondta, az előadók közül is azokat részesítik inkább előnyben, akik maguknak írják a szöveget és a zenét. Az viszont Fluor szerint érdekes kérdés, hogy ugyanolyan hétköznapivá válhat-e az MI használata a zenében, mint mostanra az autotune alkalmazása. A Wellhello esetében hasonló kép rajzolódik ki, mint amit az Artisjus felmérése is pedzegetett: kiegészítő munkákra lehet hasznos az MI.

Fluor elmondta, az új album borítójának előkészítésekor kipróbálták, milyen lenne egy MI által generált alkotás, de a grafikus munkája jobbnak bizonyult. Videós téren még ennél is nyitottabbak: következő klipjük háttere már nem kizárt, hogy mesterséges intelligenciával készül, ami elmondása szerint költségcsökkentésre is alkalmas lehet.

Embert fogunk még hallgatni pár év múlva?

A dalszerzők napjára készítettünk három dalt: egyet csak zenészek írtak, egyet az MI készített, míg a harmadikat emberek írták az MI segítségével. Az egyértelműen látszott, hogy a közönség felismeri a teljesen MI-generálta dalt, de a másik két esetben már nem igazán véltek felfedezni különbséget

– mondta Tóth Péter Benjamin. A felmérésről elmondta, a közönségnek csupán a 13 százaléka utasította el teljes egészében azt, hogy MI által írt zenét hallgasson. Az emberi alkotást féltő hozzáállás nagyon kis rétegre korlátozódik: a legtöbben úgy voltak vele, kíváncsiak arra, mire képes a mesterséges intelligencia, vagy egyáltalán nem érdekli őket, ki írta az adott dalt, a lényeg, hogy jó legyen.

Bárhogy is alakul a mesterséges intelligencia szabályozása és az előadóknak történő visszaosztás, az egyértelmű, hogy a streaming megjelenése után az MI-vel még inkább irányadó trenddé válhat a zenei alkotás élményének és közlésének demokratizálódása. A modern szoftverek révén ugyanis olyanok is tudnak zenét írni és közölni, akiknek nincs komoly zenei képzettségük, és komolyabb platformjuk sem.

Ezt bizonyítják azok a hazai sikertörténetek is, melyekben fiatal előadók egy-két év alatt eljutottak oda, hogy arénákat képesek megtölteni.

Tóth Péter Benjamin és Fluor is úgy látja, az előadók személye és a dalszövegekben leírt személyes történetek annyira emberiek, hogy nem valószínű, hogy ezeket az MI képes lenne betölteni. A szakértő szerint viszont könnyen lehet, hogy pár éven belül a világhírű előadók szövegeiben is felbukkannak MI által írt mondatok, ugyanis esetükben korábban sem volt fontos igazán, ki írja a dalt.

Az a lényeg, kihez tudnak kötődni a rajongók, ki adja elő a dalokat.