Datu izmantošana joprojām ir pretrunīgi vērtēta tēma mākslīgā intelekta pasaulē. Mēģinot nomierināt ūdeņus, galvenie nozares dalībnieki ir veikuši darījumus ar sociālajām vai satura platformām. Viens no šādiem gadījumiem ir partnerība starp Reddit un Google. Tagad saistītā attīstībā Reddit notiek diskusijās ar Google, lai pārskatītu tā satura apmaiņas līgumu AI apmācībai, kas sākotnēji tika izveidots vairāk nekā pirms gada par paziņotajiem 60 miljoniem dolāru gadā.
Sarunas starp abiem uzņēmumiem koncentrējas uz divām galvenajām jomām (ziņo Bloomberg). Pirmkārt, saskaņā ar ziņojumiem, Reddit ierosina jaunu darījumu struktūru, kas attālinātu no fiksēta maksājuma un uz dinamisku cenu modeli. Saskaņā ar šo modeli Reddit kompensāciju noteiktu tas, cik bieži tā saturs tiek minēts vai tiek izmantots kā avots atbildēm, ko ģenerē AI platformas, piemēram, Google AI pārskatus. Reddit vadītāji uzskata, ka pašreizējie termini pienācīgi neatspoguļo viņu datu vērtību AI uzņēmumiem.
Reddit vēlas AI darījumu ar Google, kas viņiem dod lielāku trafiku un lietotāju
Otrkārt, Reddit meklē cita veida partnerību, kas mudinātu vairāk trafiku, ko tā saņem no Google, pārveidot par aktīviem kopienas locekļiem. Šo centienu mērķis ir risināt izaicinājumu pašreizējās attiecībās: lietotāji, kuri atrod atbildes no Reddit satura Google, bieži neapmeklē pašu platformu. Tas ierobežo Reddit spēju attīstīt savu lietotāju bāzi un ģenerēt jaunu saturu turpmākai AI apmācībai. Atrodot veidu, kā padziļināt lietotāju iesaistīšanos, partnerība varētu nodrošināt konsekventāku augstas kvalitātes datu avotu AI modeļiem.
Diskusijas notiek, jo Reddit dati ir vērtīgs resurss AI uzņēmumiem. Lielu valodu modeļi iegūst plašas datu kopas, kas nokasītas no interneta. Reddit unikālais formāts ar padziļinātu, uz lietotāju balstītām sarunām par plašu tēmu klāstu ir bieži minēts avots. Dati liecina, ka Reddit ir visvairāk citētais domēns AI rīkiem, piemēram, apjukumam un paša Google AI pārskatiem.
Citi izdevēji un platformas, kas meklē taisnīgu kompensāciju
Šī situācija nav ekskluzīva Reddit. Citi satura nodrošinātāji, ieskaitot ziņu izdevējus, arī ir uzrunājuši, kā viņu darbs tiek izmantots AI modeļu apmācībai. Piemēram, The New York Times ir iesūdzējis tiesā gan Openai, gan Google. Plašsaziņas līdzekļu platforma apgalvo, ka tā darbs tika nepareizi izmantots. Līdzīgā gadījumā Reddit ir arī iesūdzējis Openai konkurentu antropisko. Šajā gadījumā sociālo mediju platforma apgalvoja, ka AI starta nelikumīgi nokasīja savus datus, lai apmācītu savus modeļus.
Joprojām tiek gaidīts Reddit un Google sarunu rezultāts. Tomēr diskusijās uzsver, kā satura platformas cenšas izveidot jaunus veidus, kā iegūt taisnīgu kompensāciju par viņu saturu.