Az MI csillapíthatatlan étvággyal fogyasztja a YouTube-ra feltöltött családi videókat

Amerikai kutatók kimutatták, hogy a videomegosztó platformra feltöltött óriási mennyiségű, személyes jelleggel készített videó, például születésnapi videó, baráti-családi nyaralások, zenés-fotós összefoglalók, stb. valóságos svédasztalt jelentenek a mesterséges intelligenciának, ennek pedig nem mindenki örül.

A mesterséges intelligencia betanításához a fejlesztőknek rengeteg adatra van szüksége, és az OpenAI technológiai igazgatója, Mira Murati néhány hónapja egy interjúban árulta el, hogy a cég videókészítő mesterséges intelligenciáját, a Sorát YouTube-videókon képzi ki - írja a hvg.hu.

Emiatt a YouTube vezérigazgatója, Neal Mohan rögtön felháborodását fejezte ki, holott a videomegosztó platformot működtető vállalat is hasonló koncepció alapján képzi saját MI-jét.

A Massachusettsi Amherst Egyetem médiakutatói arra voltak kíváncsiak, hogy mit is jelent pontosan az, hogy a YouTube-videóin tréningezi algoritmusát az OpenAI. Tanulmányukat a Journal of Quantitive Description: Digital Media című tudományos lapban publikálták. A csapat két kutatója, Ryan McGrady és Ethan Zuckerman a The Conversation-ben megjelent cikkben kiemelte a tanulmány fontosabb megállapításait, az adatokat pedig a TubeStars oldalán is közölték.

A szakemberek úgy becsülik, hogy a YouTube-ra eddig körülbelül 14,8 milliárd videót töltöttek fel a felhasználók, és a számuk folyamatosan növekszik. A platformon videók 70 százaléka az oldal ajánló algoritmusától származik - ezek például a szokásos influenszertartalmak -, ám ez nem azt jelenti, hogy a YouTube-on ezek a tartalmak vannak többségben - írja a lap.

A kutatók szerint a videók nagy része személyes jellegű: családi ünnepségekről készült felvételek, zenés szelfik, házi feladatok és azok megoldásai, vagy éppen táncoló gyerekek.

Vagyis a videók jelentős részét nem a széles nyilvánosságnak szánták. Erről árulkodik ezen tartalmak alacsony nézettsége és az emellett magas lájk- és hozzászólás-arány. Emellett sok olyan felvétel is van a platformon, ami a koronavírus-járvány idején készült: oktatási anyagok, konferenciahívások felvétele és hasonlók, amelyeket szintén csak egy kis közönségnek szántak.

A szakemberek úgy vélik, nem csak amiatt aggályos a mesterségesintelligencia-modellek YouTube-videókon való kiképzése, mert arra a készítők nem adtak engedélyt, hanem azért is, mert rengeteg a felületen az olyan tartalom, amit nem a széles közönségnek szántak. És azt maguk a cégek, tehát az OpenAi vagy éppen a Google nem tudják befolyásolni, hogy ezekhez az MI ne nyúljon betanuláskor - ami komoly adatvédelmi aggályokat vet fel.

Azt is megállapította a vizsgálat, hogy A YouTube-on nyugtalanítóan sok olyan tartalom is található, amit gyerekek készítettek és ők is szerepelnek benne.

Igaz, hogy a platform szabályzata szerint 13 év a felhasználói korhatár, ám minden jel arra utal, hogy ezt inkább csak amolyan iránymutatásként kezelik, semmint betartott szabályként. A tanulmány szerint ugyanis a videók legalább ötödében 13 évnél fiatalabbak szerepelnek, és ezeken a gyerekek arca is látható. A szakemberek nem számították ide azokat a videós tartalmakat, amiket egyértelműen a szülők vagy gondviselők beleegyezésével készítettek.

Mint írják, a kutatók álláspontja szerint az olyan cégek, mint az OpenAI számára egy háromfős baráti társaság beszélgetése sokkal értékesebb lehet, mint egy több millió megtekintéssel rendelkező influenszer monológja, vagy egy zenei videó. Vagyis nem igaz, hogy az okos algoritmusokat a népszerű videókon tanítanák be a vállalatok.

A szakemberek szerint figyelembe kell venni, hogy az iparág még mindig nincs megfelelően szabályozva, és leginkább a tech-vállalatok önszabályozása vethet gátat az ilyen tartalmak felhasználásának. Viszont a cégek nem érdekeltek abban, hogy a számukra értékes adatokkal szolgáló tartalmakat kihagyják modelljük tanításából.