Tiek ziņots, ka Meta AI apmācībai ir straumēta 82TB ar autortiesībām aizsargātām grāmatām

Facebook mātesuzņēmums Meta ir iespējama juridiska jucekļa vidū pēc tam, kad ir iesniegta tiesas grupa. Tiesas process apsūdz Meta par ar autortiesībām aizsargātu materiālu izmantošanu bez atļaujas AI produktu izstrādei. Jaunā atjauninājumā tiek uzskatīts, ka meta ir izveidojusi torrentas līdz 82 TB satura AI apmācībai.

“Jaunais” tiesas prāva pret Meta radās 2025. gada janvāra vidū. Tas faktiski ir turpinājums tiesas prāvai, kas sākotnēji tika iesniegta 2023. gadā, kas jau tika noraidīta. Prasītāji apgalvoja, ka meta nelikumīgi izmanto grāmatu saturu, lai apmācītu savus LLAMA AI modeļus. Tajā laikā tika lēsts, ka firmas izmantotā ar autortiesībām aizsargāta satura daudzums ir 32TB. Tiek ziņots, ka dati tika iegūti no Libgen – datu kopas, kas kādu laiku bija pieejama internetā un kurā bija visa veida grāmatu saturs – no komēdijas līdz zinātnei.

Datu kopu lielums, par kuru, kā tiek ziņots, ir meta, kuru AI apmācība, sasniedz 82TB

Tomēr jaunākie lietas atjauninājumi atklāj, ka Meta, iespējams, ir izmantojusi daudz lielāku datu daudzumu. Papildus Libgen, Meta, kā ziņots, izmantoja Annas arhīvu un Z-bibliotēku datu kopas. Kopumā dokumentā pieminēts, ka Meta faktiski torrentēja apmēram 82 TB failu AI apmācībai.

Lietā iesniegtie pierādījumi liecina par iespējamām bažām, ko pauduši darbinieki, kas iesaistīti Meta projektā. VaiEs nedomāju, ka mums vajadzētu izmantot pirātu materiālu. Man tiešām šeit ir jānovelk līnija“Vecākais AI pētnieks, kā ziņots, sacīja 2022. gadā.”Piratāta materiāla izmantošanai vajadzētu būt ārpus mūsu ētiskā sliekšņa”Sacīja cits pētnieks. VaiSciHub, Researchgate, Libgen pamatā ir kā pirātebay vai kaut kas tamlīdzīgs, tie izplata saturu, ko aizsargā autortiesības, un viņi to pārkāpj”Viņi piebilda.

Sākotnējā sūdzībā arī tiek apgalvots, ka Marks Zuckerbergs apzinājās datu kopu izcelsmi. Tomēr sanāksmē 2023. gadā Meta izpilddirektors, kā ziņots, apstiprināja to izmantošanu. VaiMums tas jāpārvieto uz priekšu… mums jāatrod veids, kā to visu atbloķēt”Ziņoja Zuckerbergs. VaiTorrenting no korporatīvā klēpjdatora nejūtas pareizi (smejoties skaļi emocijzīmes),”Viens meta darbinieks, kā ziņots, stāstīja citam sarunā.

Meta varēja mēģināt izvairīties no lejupielāžu pēdu atstāšanas

Dokumenti pat apgalvo, ka Meta veica pasākumus, lai paslēptu savus soļus. Tiek ziņots, ka uzņēmums mēģināja novērst aiziešanas pēdas, kas ļautu izsekot datu kopas lejupielādes darbību tās serveros. Tas nozīmē, ka Meta, iespējams, apzināti mēģināja izvairīties no autortiesību likumiem.

Neizskatās, ka drīzumā būs risinājums. Pirmie lēmumi šajā jautājumā ir gaidāmi dažu mēnešu laikā. Turklāt, ja izlaide ir negatīva meta, viņi noteikti pārsūdzēs, kas vēl vairāk pagarinās procesu. Iespējams, ka galu galā mums nebūs galīgā sprieduma par šo lietu tikai gadiem pēc šī brīža. Šis tiesas prāvas un citi – ir piemērs tam, kā AI apmācības autortiesības paliek “pelēkā zonā” gadus vēlāk.