Runway, citam AI uzņēmumam, kas pārmeklē tehnoloģiju nozari, ir jaudīgs video ģenerēšanas modelis ar nosaukumu Gen-3 Alpha. Lai gan tas ir spēcīgs, daži cilvēki nav apmierināti ar to, kā uzņēmums ieguva videoklipus, lai to apmācītu. Saskaņā ar jauno ziņojumu, Runway, iespējams, pirātizēja daudzus videoklipus, lai apmācītu savu AI modeli, tostarp YouTube videoklipus.
Nespēlēsim stulbus; gandrīz jebkurš medijs, ko mēs redzam internetā, iespējams, ir nokasīts un izmantots AI modeļa apmācīšanai. Tas ietver rakstus, grāmatas, ierakstus sociālajos tīklos, attēlus, aplādes, videoklipus utt. Uzņēmumi skrāpē visu šo saturu mums zem deguna, un neviens to nezina, kamēr šādi stāsti nav parādījušies virspusē. Tas ir diezgan skumji.
Pirms dažiem mēnešiem bija neliela drāma par to, vai OpenAI izmantoja YouTube, lai apmācītu Sora, savu video ģenerēšanas rīku. Tas tikai parāda, ka YouTube un Google nepieļaus, ka uzņēmumi izņem datus no YouTube. Kopš tā laika strīds ir klusējis.
Runway, iespējams, satur pirātiskus videoklipus, lai apmācītu savu AI modeli
Skrejceļa modelis ir iespaidīgs, taču, lai to apmācītu, būtu nepieciešams daudz video datu. Šiem video datiem bija jānāk no kaut kurienes, un 404 Media ir atklājis, no kurienes šie dati varētu būt nākuši. Uzņēmums atklāja izklājlapu, kurā bija saites uz daudziem YouTube kanāliem. Šajos kanālos ietilpst Mr. Beast, MKBHD, The Try Guys, Nintendo, BuzzFeed, Netflix, Linus Tech Tips, Sems Kolders un daudzi citi.
Skrejceļš neapstājās pie YouTube. Izklājlapā ir arī saites uz tādām vietnēm kā KissCartoon, kas ir pirātisma vietne. Kopumā izklājlapā ir gandrīz 4000 saišu. Katrā izklājlapas rindā ir informācija par YouTube kanāliem, piemēram, videoklipu skaits un to veidotais saturs.
Saskaņā ar ziņojumiem uzņēmums izmantoja rāpuļprogrammu, lai faktiski lejupielādētu šos videoklipus un ievadītu tos modelī. It kā tas nebūtu pietiekami slikti, Runway, iespējams, izmantoja starpniekserveri, lai izvairītos no Google atklāšanas. Tātad uzņēmums zināja, ka Google būs apmulsis, skrāpējot video datus.
Mēs neesam pārliecināti, cik liela daļa izklājlapas datu faktiski tika izmantota modeļa apmācīšanai. Mēs, iespējams, nekad neuzzināsim, diemžēl.
Juridiskās sekas
Tam var būt diezgan smagas juridiskas sekas. Uzņēmumi, piemēram, Microsoft un OpenAI, jau tiek saukti tiesā par datu nokasīšanu no New York Times. YouTube var būt juridisks pamats iesūdzēt Runway atkarībā no tā, cik daudz neapstrādātu video datu uzņēmums ir nokopis.
Turklāt sarakstā iekļautie YouTube kanāli ietver kanālus no dažiem diezgan lieliem uzņēmumiem, piemēram, Disney, Netflix un Nintendo. Mēs esam pārliecināti, ka šo uzņēmumu kanālos ir daži ar autortiesībām aizsargāti videoklipi. Vēsture mums ir iemācījusi, ka, ja jūs sajaucat ar Nintendo, jūs vienkārši lūdzat tiesas prāvu.
Visbeidzot, mēs nevaram ignorēt faktu, ka tas, iespējams, ir lejupielādējis videoklipus no pirātu vietnes. Ja tā ir taisnība, tad tas būs tiešs likuma pārkāpums.
Tagad, kad šī informācija ir publiska, mums būs tikai jāredz, kas notiek ar uzņēmumu un tā video modeli.