OpenAI iepazīstina ar o3 — nākamās paaudzes spriešanas modeli, kas tuvojas AGI

OpenAI ir paziņojis par saviem jaunākajiem AI spriešanas modeļiem o3 un o3-mini, kuru mērķis ir risināt sarežģītas problēmas ar lielāku precizitāti un efektivitāti. Šie modeļi ir ievērojams lēciens mākslīgā intelekta iespējās, balstoties uz 2024. gada septembrī ieviestās o1 sērijas pamatiem.

O3-mini modelis, kas izstrādāts kā ātrāka un destilēta o3 versija, kas optimizēta kodēšanas uzdevumiem, tiks izlaista līdz 2025. gada janvāra beigām. Pilns o3 modelis sekos neilgi pēc tam. Pašlaik abiem modeļiem tiek veikta stingra drošības novērtēšana, un OpenAI aicina drošības un drošības pētniekus piedalīties agrīnā testēšanā, un lietojumprogrammas ir atvērtas līdz 2025. gada 10. janvārim.

Ziņā par X OpenAI dalījās ar informāciju par šiem jaunajiem modeļiem un uzsvēra savu apņemšanos nodrošināt drošību un uzticamību. Paziņojumā uzsvērts, ka o3-mini ir pirmā versija, kas, visticamāk, būs pieejama publiski, piedāvājot izstrādātājiem un kodētājiem ieskatu o3 sērijas praktiskajos lietojumos.

Atverot agrīnās piekļuves lietojumprogrammas, OpenAI sniedz pētniekiem unikālu iespēju sniegt ieguldījumu šo pārveidojošo AI modeļu pilnveidošanā pirms to izlaišanas 2025. gadā.

“Šodien mēs dalījāmies ar vērtējumiem nākamā modeļa agrīnai versijai mūsu o-modeļa argumentāciju sērijā: OpenAI o3,” vietnē X sacīja OpenAI.

Šodien mēs dalījāmies ar vērtējumiem nākamā modeļa agrīnai versijai mūsu o-modeļa argumentāciju sērijā: OpenAI o3 pic.twitter.com/e4dQWdLbAD

— OpenAI (@OpenAI) 2024. gada 20. decembris

Kas padara o3 nozīmīgu?

o3 sērija ievieš revolucionāru “privātās domu ķēdes” metodoloģiju. Tas ļauj modeļiem simulēt cilvēkiem līdzīgu spriešanu, iekšēji apspriežoties un plānojot pirms atbildes ģenerēšanas. Sadalot sarežģītus uzdevumus mazākos, pārvaldāmos soļos, o3 modeļu mērķis ir uzlabot problēmu risināšanas precizitāti un efektivitāti.

Šī pieeja atspoguļo izmaiņas tajā, kā AI rīkojas ar argumentāciju, dodot priekšroku pārdomātībai, nevis ātrumam. Lai gan tas nozīmē, ka atbildes var aizņemt ilgāku laiku, kompromiss ir augstāks izsmalcinātības un precizitātes līmenis pat sarežģītos scenārijos.

Kā o3 darbojas?

Neatkarīgi novērtējumi izceļ o3 kā izrāvienu AI argumentācijā. Modelis ir sasniedzis nepieredzētus rezultātus vairākos etalonos, tostarp:

ARC-AGI etalons: Iegūts 87,5% augstas aprēķinu scenārijos, kas cieši atbilst cilvēka veiktspējas līmenim.
Amerikas ielūguma matemātikas eksāmens (AIME) 2024: Iegūts 96,7%, trūkst tikai viena jautājuma.
Absolventu līmeņa fizikas, ķīmijas un bioloģijas jautājumi (GPQA Diamond): Sasniedza 87,7% rezultātu.

Kontekstam ARC-AGI etalons ir rīks, ko izmanto, lai novērtētu AI spēju apgūt jaunas prasmes ārpus apmācības datiem. Parasti tiek uzskatīts, ka 85% rezultāts atbilst cilvēka veiktspējai. OpenAI o1 modelis šajā etalonā ieguva 25–32%, savukārt o3 ir sasniedzis trīskāršu uzlabojumu, nostiprinot savu pozīciju kā nākamās paaudzes spriešanas AI.

JAUNUMS: OpenAI tikko paziņoja par “o3” — izrāvienu AI modeli, kas etalonos ievērojami pārspēj visus iepriekšējos modeļus.

— ARC-AGI: o3 vairāk nekā trīskāršo o1 rezultātu ar zemu aprēķinu un pārsniedz 87%
— EpochAI Frontier Math: o3 uzstādīja jaunu rekordu, atrisinot 25,2% no… pic.twitter.com/mELIIFHLe5

— Rowan Cheung (@rowancheung) 2024. gada 20. decembris

Solis AGI virzienā

Lai gan o3 nav mākslīgais vispārējais intelekts (AGI), tā iespējas izjauc robežu starp progresīvām AI sistēmām un patieso vispārējo intelektu. Praktiskos scenārijos tas veic uzdevumus ar precizitāti, kas bieži vien var atšķirties no cilvēka problēmu risināšanas.

Šis sasniegums aicina kritiski pārdomāt ietekmi uz nozarēm, jaunizveidotiem uzņēmumiem un plašāku AI ekosistēmu. Tā kā AI modeļi, piemēram, o3, turpina virzīt robežas, tie no jauna nosaka, kas ir iespējams tādās jomās kā izglītība, pētniecība un sarežģītu lēmumu pieņemšana.

OpenAI o3 sērija ir pamats jaunam AI argumentācijas laikmetam ar potenciālām lietojumprogrammām, kas varētu pārveidot mūsu mijiedarbību ar tehnoloģijām. Dibinātājiem un novatoriem jāņem vērā — šī ir attīstība, kas var pārveidot nozares.