OpenAI ceturtdien prezentēja savu jaunāko darbu Sora, kas lepojas ar spēju izveidot pārliecinošus un tēlainus 60 sekunžu video, pamatojoties uz īsiem teksta uzvednēm.
Emuāra ierakstā populārā ChatGPT veidotājs teica, ka Sora spēj tulkot teksta norādījumus dinamiskos vizuālos stāstījumos, kas papildināti ar dažādiem varoņiem, īpašām kustībām un sarežģītiem fona iestatījumiem.
“Modelis ne tikai aptver lietotāja uzvednes būtību, bet arī saprot, kā šie elementi izpaužas reālās pasaules scenārijos,” piebilsts emuāra ierakstā. OpenAI arī pauda apņemšanos pilnveidot šos AI modeļus, lai palīdzētu cilvēkiem risināt problēmas, kurām nepieciešami taustāmi, reāli risinājumi.
“Mēs mācām AI izprast un simulēt fizisko pasauli kustībā, lai izveidotu apmācības modeļus, kas palīdz cilvēkiem atrisināt problēmas, kurām nepieciešama reāla mijiedarbība. Iepazīstinām ar Sora, mūsu teksta pārvēršanas video modeli. Sora var ģenerēt līdz pat minūtei garus videoklipus, vienlaikus saglabājot vizuālo kvalitāti un lietotāja norādījumu ievērošanu, ”sacīja OpenAI.
Uzņēmums arī iesaistījās sociālajos medijos, lai paziņotu par jaunā AI teksta-video ģenerēšanas modeļa palaišanu. Ziņā vietnē X (iepriekš Twitter) OpenAI teica:
“Sora var izveidot līdz 60 sekundēm garus videoklipus, kuros ir ļoti detalizētas ainas, sarežģītas kameras kustības un vairāki varoņi ar dinamiskām emocijām.”
Iepazīstinām ar Sora, mūsu teksta pārvēršanas video modeli.
Sora var izveidot līdz 60 sekundēm garus videoklipus, kuros ir ļoti detalizētas ainas, sarežģītas kameras kustības un vairāki varoņi ar dinamiskām emocijām. https://t.co/7j2JN27M3W
Uzvedne: “Skaisti, sniegoti… pic.twitter.com/ruTEWn87vf
— OpenAI (@OpenAI) 2024. gada 15. februāris
Sora iezīmē jaunāko soli OpenAI pastāvīgajos centienos attīstīt ģeneratīvā AI jomu. Lai gan “multimodālie modeļi” nav gluži jauni un teksta pārveides iespējas jau pastāv, saskaņā ar ABI Research vecākā analītiķa Rīsa Heidena teikto Sora atšķiras ar OpenAI apgalvoto garumu un precizitāti.
Neskatoties uz to, ka Altmans savā amatā minēja, ka tas vēl nav gatavs plašai lietošanai, jo bija nepieciešama rūpīga drošības pārbaude un aizsardzība pret iespējamiem trūkumiem un ļaunprātīgu izmantošanu, dibinātājs pieminēja, ka pašlaik tas ir pieejams noteiktai satura veidotāju grupai un plāno plašāka pieejamība nākotnē.
Tālāk OpenAI līdzdibinātājs un izpilddirektors Sems Altmens ir kopīgojis video, kurā parādītas Sora iespējas.
https://t.co/SOUoXiSMBY pic.twitter.com/JB4zOjmbTp
— Sems Altmens (@sama) 2024. gada 15. februāris