Kāds šobrīd ir visgudrākais AI modelis tirgū?

Kopsavilkums: Jauns ziņojums tikko sastādīja to gudrāko AI modeļu sarakstu, kas ir pieejami sabiedrībai. Sarakstā ir iekļauti modeļi no Google, Openai, Deepseek, Xai un Antropic.

Šajā brīdī tas īsti nezina, kurš AI modelis ir gudrāks, jo vairums no tiem ir ārkārtīgi inteliģenti. Tātad, to apkopošana lielākoties ir kā matiņu sadalīšana. Tomēr joprojām ir interesanti uzzināt, kuri modeļi var darīt visvairāk. Uzņēmumi ir ātri sasnieguši AGI sasniegšanu, tāpēc mēs vēlamies zināt, kurš no tiem ir vistuvākais.

Jauns ziņojums no Neirons Paņēma visaugstākos AI modeļus no tādiem uzņēmumiem kā Google, Openai, Anthropic, Xai un DeepSeek, un viņiem bija jāsaskaras. Iespējams, ka augšējais AI modelis jūs nepārsteigs, un tur ir arī izcils modelis.

Kāds šobrīd ir gudrākais AI modelis tirgū?

Šajā testā izmantotie modeļi ir O4-Mini, O3-Mini, O1-Mini, Gemini 2.5 Pro Preview, Grok 3 Mini pētījumi, DeepSeek R1 un Antropic Claude 3.7 soneta domāšana. Šie ir gandrīz visspēcīgākie modeļi tirgū. Tie tika izvadīti caur mākslīgās analīzes intelekta indeksu, un katram no tiem tika piešķirts īpašs skaitlisks vērtējums.

Viena lieta, kas jāatzīmē, ir tas, ka etalona rādītāji nav vienīgais veids, kā novērtēt modeļa inteliģenci. Tomēr viņi sniedz zināmu stabilu informāciju par to, kur viņi atrodas. Raugoties uz rezultātiem, parādās dažas lietas.

Pirmkārt, mēs redzam, ka Openai visspēcīgākais modelis O4-Mini spēja pārspēt sacensības, iegūstot 70 punktus. Tam cieši sekoja Gemini 2.5 Pro priekšskatījums ar 68 punktiem. Tātad, pamatojoties uz rezultātu, šie divi modeļi ir diezgan daudz kakla un kakla.

Nākamie daži modeļi tikai ar dažiem punktiem. Pārsteidzoši ir tas, ka grok 3 mini ir tik augsts. XAI ir salīdzinoši jauns, salīdzinot ar citiem saraksta uzņēmumiem. Tas nav bijis apmācības modeļi, kamēr vien Openai vai Google, tāpēc ir pārsteidzoši, ka tas spēj tik cieši sekot konkurencei.

Saraksts izslēdzas ar DeepSeek R1 (60), Claude 3.7 Sonnet domāšanu (57) un O1-Mini (54). DeepSeek, tikai pirms dažiem mēnešiem, pārtrauca internetu ar savu modeli, kas diezgan daudz iznāca no nekurienes. Tagad izskatās, ka tas ir atpalicis no konkursa. Pa to laiku Openai un Google ir izlaiduši dažus jaunus un jaudīgākus modeļus.

Cena

Kā norādīts ziņojumā, labākais kopējais modelis ir O4-Mini, bet Gemini 2.5 Pro priekšskatījums bija labākais, kad runa bija par cenu. Tas ir kaut kas, kas varētu mudināt vairāk izstrādātāju izmantot Dvīņu API. Abi modeļi ir salīdzināmi, tāpēc izstrādātāji mazāk varēs ieviest vairāk AI savā darbplūsmā.

Kings cik ilgi?

Ir svarīgi zināt, ka AI modeļu pasaule pastāvīgi mainās. Uzņēmumi uz brīdi paziņo jaunas funkcijas un atjauninājumus modeļiem. Openai modelis ir suņu kaudzes augšdaļā, bet tas nav daudz. Nav teikts, vai nāks jauns modelis no Google, DeepSeek vai Meta, un to atcels.

Meta nesen paziņoja, ka tā visspēcīgākais modelis ir ceļā. Mēs nezinām, vai šis modelis visiem labākajiem AI uzņēmumiem dos savu naudu.