OpenAI COO atteicās atbildēt, vai Sora ir apmācīta par YouTube videoklipiem

OpenAI teksta-video modelis Sora ir gan iespaidīgs, gan biedējošs atkarībā no perspektīvas. Tas var palīdzēt pārvērst savas idejas videoklipā pat bez kameras. Bet tas var arī aizņemt šos darbus. Tiem, kas nav pazīstami, mākslīgā intelekta modelis ģenerē līdz pat minūti garus videoklipus, pamatojoties uz vienkāršiem teksta aprakstiem.

Microsoft atbalstītais starta uzņēmums tikko ir izlaidis pirmo lielo mūzikas video, ko radījis Sora. Svarīgi, ka modelis joprojām atrodas testēšanas fāzē un vēl nav pieejams sabiedrībai. Tātad joprojām ir iespējami uzlabojumi dažādos aspektos.

Vai OpenAI apmācīja Soru YouTube videoklipos?

Pagājušajā mēnesī YouTube izpilddirektors jau brīdināja OpenAI neizmantot savus videoklipus, lai apmācītu Soru. Jaunākajā intervijā Bloomberg tehnoloģiju samitā COO Breds Lightcap runāja par viņu AI produktu potenciālajiem lietojumiem uzņēmējdarbībā. Sarunā parādījās arī viens no ievērojamākajiem startup produktiem, kuram ir potenciāli biznesa pielietojumi. Runājot par Soru, intervētājs uzdeva jautājumu – “Kādi apmācības dati tika izmantoti modeļa apmācīšanai?”

Konkrētāk, intervētājs piespieda OpenAI amatpersonu galīgi noskaidrot, vai viņi apmācīja Soru YouTube videoklipos. Tomēr šķita, ka Lightcap nevēlējās sniegt tiešu atbildi. Tā vietā viņš apsprieda dažādus aspektus, tostarp satura ģenerēšanu, šī satura izmantošanu kā datus modeļu apmācībai, datu izmantošanas pārredzamības nodrošināšanu, iespējamos ieguvumus satura veidotājiem un daudz ko citu. Tomēr viņš nevienu reizi nepieminēja YouTube savā aprakstošajā “neatbildē” uz jautājumu, vai OpenAI ir apmācījis Soru par platformas videoklipiem vai nē.

COO Breds Laitkeps atteicās atbildēt uz jautājumu

“Tātad, jā, mēs skatāmies uz šo problēmu, tas ir patiešām grūti. Mums vēl nav visu atbilžu,” viņš nobeidza. OpenAI patiešām dalījās ar informāciju par “tiešsaistē redzamā un dzirdamā avota izpratni”. Tomēr galvenokārt runa bija par satura autentiskumu un to, kā viņi plāno saglabāt satura avota pārredzamību. Tomēr ziņojumā īsti netika runāts par to, kādus datus viņi ir izmantojuši vai izmanto, lai apmācītu valodu modeļus. Nemaz nerunājot par to, ka tajā netika runāts arī par YouTube satura izmantošanu.

Atgādinām, ka uzņēmuma CTO Mirai Murati arī pagājušajā mēnesī tika uzdots tāds pats jautājums par Soru. Viņa arī nevarēja sniegt skaidru atbildi uz jautājumu.

Saskaņā ar ziņojumiem šī gada sākumā OpenAI izmantoja YouTube videoklipus, lai apmācītu GPT-4, kas ir pretrunā platformas noteikumiem. Tomēr Google arī ziņoja, ka rīkojās tāpat. Runājot par Sora treniņu datiem, sarežģītā bezatbilde liecina par YouTube video izmantošanas iespējām. Modelis varētu tikt publiskots 2024. gada otrajā pusē, iespējams, augustā.