Meta iesūdzēja tiesā par ar autortiesībām aizsargātu grāmatu izmantošanu AI apmācībai

Vai Meta pārkāpa likumu? Autori apgalvo, ka uzņēmums bez atļaujas izmantojis viņu grāmatas. Saskaņā ar neseno pieteikumu par autortiesību pārkāpumu tiesā, Facebook un Instagram mātesuzņēmums Meta Platforms, iespējams, ignorēja juridiskos brīdinājumus par tūkstošiem pirātisku grāmatu izmantošanas risku, lai apmācītu savus mākslīgā intelekta modeļus.

Komiķe Sāra Silvermena, Pulicera balvas ieguvējs Maikls Čabons un citi autori iesniedza divas tiesas prāvas pret Meta, apsūdzot uzņēmumu par viņu darbu izmantošanu bez atļaujas, lai apmācītu savu mākslīgā intelekta valodas modeli Llama. Lai gan Kalifornijas tiesnesis nesen noraidīja daļu no Silvermana prasības, autoriem tika dota atļauja grozīt savus apgalvojumus, ziņo Reuters.

Jaunākajā pirmdienas pieteikumā autori iepazīstināja ar Meta saistītā pētnieka tērzēšanas žurnālus, apspriežot datu kopas iegādi Discord serverī. Šie pierādījumi liecina, ka Meta apzinājās, ka tās grāmatu izmantošanu, iespējams, neaizsargā ASV autortiesību likums. Tērzēšanas žurnālos pētnieks Tims Detmers pieminēja diskusijas ar Meta juridisko nodaļu par grāmatu failu izmantošanas kā apmācības datu likumību.

Detmers 2021. gadā paziņoja, ka Facebook bija ieinteresēta strādāt ar datu kopu, kas pazīstama kā The Pile, taču juridisku iemeslu dēļ to nevarēja izmantot pašreizējā formā. Sūdzībā arī tika uzsvērts Detmera paziņojums, ka Meta advokāti viņu informējuši, ka datus nevar izmantot vai publicēt modeļus, ja viņi ir apmācīti par šiem datiem.

“Facebook ir daudz cilvēku, kuri vēlas strādāt ar (T)he (P)ile, tostarp es, taču tā pašreizējā formā mēs nevaram to izmantot juridisku iemeslu dēļ,” rakstīja Detmers.

Lai gan tērzēšanas žurnālos nav sniegta informācija par juristu bažām, ir pieminētas bažas par “grāmatām ar aktīvām autortiesībām”. Pētnieki tērzēšanas sarunā ierosināja, ka apmācībai par datiem būtu jāattiecas uz godīgu izmantošanu — ASV juridisko doktrīnu, kas aizsargā dažus ar autortiesībām aizsargātu darbu nelicencētu izmantošanu.

Tehnoloģiju giganti, tostarp Meta, šogad ir saskārušies ar daudzām tiesas prāvām no satura veidotāju puses, kas viņus apsūdz ar autortiesībām aizsargātu darbu izmantošanā ģeneratīvu AI modeļu veidošanā. Veiksmīgi iznākumi šajos gadījumos varētu palielināt šādu modeļu izveides izmaksas, jo uzņēmumiem var tikt prasīts kompensēt satura veidotājiem par viņu darbu izmantošanu.

Turklāt jauni noteikumi Eiropā, kas regulē mākslīgo intelektu, var likt uzņēmumiem izpaust datus, ko izmanto, lai apmācītu savus modeļus, pakļaujot tos turpmākiem juridiskiem riskiem.

Kā ziņojām šī gada sākumā, Meta februārī izlaida savu lamu valodas modeļa pirmo versiju. Llama tika izstrādāta, lai ģenerētu tekstu un sarunas, apkopotu rakstisku materiālu un veiktu sarežģītus uzdevumus, piemēram, matemātikas teorēmu risināšanu vai olbaltumvielu struktūru prognozēšanu.

Palaišanas laikā Meta atklāja arī tādu datu kopu izmantošanu kā “ThePile Books3 sadaļa”. Tomēr uzņēmums neatklāja apmācības datus par jaunāko versiju Llama 2, kas kļuva pieejama komerciālai lietošanai vasarā. Llama 2 ir bezmaksas uzņēmumiem, kuru ikmēneša aktīvo lietotāju skaits ir mazāks par 700 miljoniem, un tiek uzskatīts par potenciālu spēļu mainītāju ģeneratīvās AI programmatūras tirgū.