OpenAI izlaiž priekšskatījumu o1 — jaunai AI modeļu sērijai, kas izstrādāta, lai domātu, pirms tie reaģē

OpenAI tikko ir ieviesis OpenAI o1 priekšskatījumu, jaunu AI modeļu sēriju, kam ir nepieciešams vairāk laika, lai pārdomātu, pirms atbildēt. Saskaņā ar ChatGPT uzņēmumu, šie modeļi ir labāk aprīkoti, lai veiktu sarežģītus uzdevumus un atrisinātu sarežģītākas problēmas zinātnē, kodēšanā un matemātikā nekā to priekšgājēji.

“Mēs izlaižam pirmo no šīs sērijas ChatGPT un mūsu API. Šis ir priekšskatījums, un mēs sagaidām regulārus atjauninājumus un uzlabojumus. Kopā ar šo laidienu mēs dalāmies ar vērtējumiem par nākamo atjauninājumu, kas pašlaik ir izstrādes stadijā,” OpenAI dalījās emuāra ziņā.

Šis priekšskatījums seko OpenAI izlaišanai GPT-4o mini, kas ir mazāka, rentabla tērzēšanas robota versija. GPT-4o mini, kas tiek raksturots kā “visspējīgākais un izmaksu ziņā efektīvākais mazais modelis, kas pieejams mūsdienās”, ir iestatīts, lai ar laiku iekļautu attēla, video un audio iespējas.

Mēs izlaižam OpenAI o1 priekšskatījumu — jaunu AI modeļu sēriju, kas izstrādāta, lai pavadītu vairāk laika, domājot, pirms tie reaģē.

Šie modeļi var veikt sarežģītus uzdevumus un atrisināt grūtākas problēmas nekā iepriekšējie zinātnes, kodēšanas un matemātikas modeļi. https://t.co/peKzzKX1bu

— OpenAI (@OpenAI) 2024. gada 12. septembris

Kā tas darbojas

Saskaņā ar OpenAI teikto, šie jaunie o1 modeļi ir apmācīti rūpīgāk pārdomāt problēmas pirms reaģēšanas, līdzīgi cilvēku domāšanai. Tie ir paredzēti, lai uzlabotu savu pieeju, eksperimentētu ar dažādām stratēģijām un identificētu savas kļūdas.

Testēšanas laikā gaidāmais modeļa atjauninājums bija salīdzināms ar doktorantiem, veicot sarežģītus etalonuzdevumus fizikā, ķīmijā un bioloģijā. Tas arī uzrādīja spēcīgus rezultātus matemātikā un kodēšanā. Piemēram, Starptautiskās matemātikas olimpiādes (SJO) kvalifikācijas eksāmenā GPT-4o pareizi atrisināja 13% uzdevumu, bet spriešanas modelis sasniedza 83%. Modeļa kodēšanas prasmes tika novērtētas Codeforces konkursos, kur tas sasniedza 89. procentili. Sīkāka informācija ir pieejama OpenAI tehniskās izpētes ziņojumā.

Šajā posmā modelim trūkst dažu funkciju, kas padara ChatGPT plaši noderīgu, piemēram, tīmekļa pārlūkošana un iespēja augšupielādēt failus un attēlus. Tomēr sarežģītiem argumentācijas uzdevumiem šis laidiens iezīmē lielu soli uz priekšu mākslīgā intelekta spēju jomā. Lai atspoguļotu šo jauno posmu, sērija ir nosaukta OpenAI o1.

Drošības pasākumi

Izstrādājot šos modeļus, OpenAI ieviesa jaunu drošības apmācības pieeju, izmantojot viņu argumentācijas spējas, lai labāk atbilstu drošības vadlīnijām. Tas nozīmē, ka modelis var efektīvāk piemērot drošības noteikumus kontekstā.

Viena no drošības mērīšanas metodēm ietver pārbaudi, cik labi modelis atbilst tā vadlīnijām, pat ja lietotāji mēģina tās apiet (prakse, kas pazīstama kā “jailbreak”). Sarežģītajā testā GPT-4o ieguva 22 no 100, savukārt o1 priekšskatījuma modelis ieguva 84 punktus. Papildinformāciju var atrast sistēmas kartē un pētījuma ziņojumā.

Lai pielāgotos šo jauno modeļu iespējām, OpenAI ir pastiprinājis savus drošības protokolus, iekšējo pārvaldību un sadarbību ar federālajām iestādēm. Tas ietver stingru testēšanu, novērtēšanu, izmantojot tās sagatavotības sistēmu, un tās Drošības un drošības komitejas uzraudzību.

Saistībā ar AI drošību OpenAI nesen noslēdza oficiālus līgumus ar ASV un Apvienotās Karalistes AI drošības institūtiem. Šie līgumi ietver agrīnas piekļuves nodrošināšanu šī modeļa izpētes versijai, kas kalpo par pamatu pētniecībai, novērtēšanai un testēšanai, pirms turpmākie modeļi tiek publiskoti.

Kam varētu būt labums

Šīs uzlabotās spriešanas iespējas varētu būt īpaši vērtīgas tiem, kas risina sarežģītas problēmas tādās jomās kā zinātne, kodēšana un matemātika. Piemēram, OpenAI o1 varētu palīdzēt veselības aprūpes pētniekiem anotēt šūnu secības datus, palīdzēt fiziķiem izveidot sarežģītas matemātiskas formulas kvantu optikai un ļaut izstrādātājiem dažādās jomās izveidot un izpildīt daudzpakāpju darbplūsmas.