OpenAI pagājušajā mēnesī prezentēja savu revolucionāro teksta-video ģeneratoru Sora, taču tas vēl nav nodrošinājis Sora publisku pieejamību. Pašlaik Sora ir red teaming stadijā un ir pieejama tikai atlasītiem māksliniekiem un satura veidotājiem, kuri testē rīku. Tiem, kas nav pazīstami, red teaming ir process, kurā cilvēki pārbauda rīku, lai pārliecinātos, ka tas ir drošs, drošs un uzticams. Mērķis ir noteikt ievainojamības, aizspriedumus un citas kaitīgas problēmas.
Intervijā laikrakstam The Wall Street Journal (maksas sienas) OpenAI tehnoloģiju direktors Mira Murati atklāja, ka Sora kļūs publiski pieejama “šogad” un, iespējams, tiks izlaista “dažu mēnešu laikā”. Šis rīks Sora ļauj lietotājiem izveidot hiperreālistiskas ainas, izmantojot tikai teksta uzvednes.
Sora ir satriecoša, bet vēl ne perfekta
Sora ģenerētajos videoklipos pašlaik nav audio. Tomēr uz jautājumu par to Murati sacīja, ka OpenAI plāno to integrēt kaut kur tālāk. Tā varētu nebūt Sora, bet vismaz viņiem ir plāni papildinājumam.
Tāpat kā daudzi teksta-attēlu ģenerēšanas rīki, arī Sora videoklipi tiks marķēti ar ūdenszīmi, lai izvairītos no ļaunprātīgas izmantošanas. Tomēr arī ūdenszīme nav ideāls problēmas risinājums. Tas ir vēl viens iemesls, kāpēc uzņēmums vēl nav izlaidis modeli sabiedrībai un, kā ziņots, to nedarīs, ja vien neuzskatīs to par drošu.
Uz jautājumu par CTO viedokli par to, kā tas varētu ietekmēt darbavietas nākotnē, viņa norādīja, ka mērķis nav aizstāt cilvēkus, bet gan kalpot Sorai kā viņiem instrumentam, ko viņi var izmantot, lai “rediģētu un radītu ar tiem”. Sora ģenerētā satura rediģēšana var būt nozīmīga, īpaši ņemot vērā neatbilstības videoklipos. The Wall Street Journal parādīja dažus viņu ģenerētus videoklipus, norādot uz dažām neatbilstībām, piemēram, dīvainām rokām un pirkstiem.
Uz jautājumu par datiem, kas izmantoti Sora apmācīšanai, Murati palika neskaidrs, norādot, ka izmantoja publiski pieejamus vai licencētus datus. Lai gan joprojām nav skaidrs, vai tika izmantoti videoklipi no tādām platformām kā YouTube, Facebook vai Instagram, Murati apstiprināja, ka Sora ietver saturu no Shutterstock, kas ir OpenAI partneris.
OpenAI mērķis ir padarīt Sora pieejamu par līdzīgu cenu kā tā teksta pārveides modelim DALL-E
Murati uzsvēra vienu ievērojamu aspektu, Sora enerģijas palielināšanas izmaksas salīdzinājumā ar iepriekšējiem mākslīgā intelekta modeļiem, piemēram, DALL-E vai ChatGPT. Viņa atzīmē, ka atšķirībā no teksta vai attēlu ģenerēšanas modeļiem Sora šobrīd ir pētniecības projekts, kura darbība maksā daudz vairāk. OpenAI būs jāsakārto skaitļošanas aprīkojums, kas tam būs nepieciešams, pirms tas tiks pasniegts sabiedrībai.
Neskatoties uz lielākiem izdevumiem, OpenAI mērķis ir padarīt Sora pieejamu sabiedrībai par “līdzīgām” izmaksām kā DALL-E, uzsverot pieejamību tās revolucionārajai tehnoloģijai.