Google atklāj Gemini 2.5 Pro, tā visgudrākais AI modelis

Google tikko izvērsa Gemini 2.5 Pro Experimental, kas līdz šim ir vismodernākais AI modelis. Šis jaunais izlaidums papildina diagrammas Lmarena līderu sarakstā, pārspējot tādus modeļus kā Claude 3.7, Grok 3 un DeepSeek-R1. Tas izceļas matemātikas, zinātnes un radošās rakstīšanas etalonos, it īpaši, ja runa ir par argumentāciju un kodēšanu.

Kas atšķir Gemini 2.5 Pro atsevišķi? Tas ir veidots, lai vairāk domātu par cilvēku. Google saka, ka modelis ne tikai izspļauj atbildes – tas pirms reaģēšanas analīzē, iemeslos un darbojas caur problēmām. Šī maiņa sniedz precīzākas, pārdomātākas atbildes, labāk izmantojot kontekstu un niansi. Tā ir gudrāka sistēma, vienkārša un vienkārša.

Atšķirībā no iepriekšējiem modeļiem, kas argumentāciju uzskatīja par pieskrūvētu, Gemini 2.5 Pro padara to par daļu no galvenās sistēmas. Izstrādātāji un agrīnie lietotāji jau ir pamanījuši atšķirību – un viņi par to runā. Un, ja agrīnie rezultāti ir kādi norāde, Gemini 2.5 nav tikai iespaidīgi – tas nosaka jaunu standartu.

Post X google google sauca Dvīņos 2.5 tā “Visgudrākais AI modelis jebkad”, un šķiet, ka rezultāti to dublē. Tagad tas ir pieejams Google AI studijā un DeMini Advanced lietotājiem lietotnē, drīzumā parādīsies plašāks izlaidums Vertex AI.

1/ Dvīņi 2.5 ir šeit, un tas ir mūsu visu laiku inteliģentākais AI modelis.

Mūsu pirmais 2,5 modelis Dvīņi 2.5 Pro Experimental ir vismodernākais domāšanas modelis, kas vada plašu etalonu diapazonu-ar iespaidīgiem uzlabojumiem pastiprinātā spriešanā un kodēšanā un tagad #1… pic.twitter.com/mtedrctcgf

– Sundar Pichai (@sundarpichai) 2025. gada 25. marts

Pastiprināta argumentācija

Dvīņi 2.5 Pro stāv etalonu augšgalā, kas pārbauda kompleksu argumentāciju – bez paļaušanās uz dārgiem risinājumiem, piemēram, vairākuma balsošanu secinājumu laikā. Tas vada matemātikas un zinātnes uzdevumus, pārspējot citus uz etaloniem, piemēram, GPQA un AIME 2025.

Tas arī nodrošina izcilu 18,8% punktu skaitu par cilvēces pēdējo eksāmenu-izaicinošu datu kopu, kuru simtiem ekspertu veidoja, lai pārbaudītu cilvēku līmeņa zināšanu un spriešanas robežas, un tas viss bez instrumentiem palīdzēja.

Uzlabota kodēšana

Gemini 2.5 Pro nodrošina galveno kodēšanas jauninājumu, pārsniedzot versiju 2.0 par plašu rezervi – ar vairāk uzlabojumiem jau ir cauruļvadā. Tas ir īpaši spēcīgs, veidojot tīmekļa lietotnes ar pulētiem vizuāliem attēliem, rakstīšanas aģenta stila kodu un rīkojoties ar tādiem uzdevumiem kā koda pārveidošana un rediģēšana.

Par SWE-bench verificēto-aģentu kodēšanas novērtēšanas etalonu-2.5. PRO 2.5.

Vai vēlaties ieskatu, ko tas var darīt? Piešķiriet tai vienas līnijas uzvedni, un tas var ģenerēt pilnu izpildāmu kodu videospēlei, izmantojot tā argumentācijas motoru, lai aizpildītu nepilnības.

https://www.youtube.com/watch?v=rlcbspgos6s

Dvīņu 2.5 Pro funkciju kopsavilkums

Šeit ir sadalījums tam, kas padara Gemini 2.5 Pro izceļas:

1 miljons marķiera konteksta logs: Tas ļauj modelim vienā piegājienā apstrādāt masīvus teksta un datu gabalus. Google saka, ka tas drīz palielināsies līdz 2 miljoniem žetonu.
Multimodālais ievades atbalsts: Gemini 2.5 Pro var apstrādāt tiešraides attēlus un videoklipus, balstoties uz funkcijām, kas ieviestas ar projektu Astra, piemēram, ekrāna koplietošanu un tiešraides video interpretāciju.
Iebūvētie rīki: Tas tieši integrējas ar Google meklēšanu un citiem rīkiem, kas palīdz sniegt precīzākas un noderīgākas atbildes.
Piekļuve tagad: Izstrādātāji to var izmēģināt bez maksas, izmantojot Google AI Studio vai API, un Gemini Advanced lietotāji tam var piekļūt, izmantojot lietotni. Google saka, ka drīz sekos informācija par cenu noteikšanu.

Viens no visvairāk sarunātajiem jauninājumiem ir maiņa, kā modelis apstrādā argumentāciju. Iepriekšējās versijās, piemēram, Gemini 2.0 Flash domāšanā, lietotājiem bija jāieslēdz īpaša funkcija, lai redzētu, kā AI apstrādā lietas. Ar 2,5 Pro šo domāšanas procesu jau no paša sākuma iekļauj domāšanas process.

Dvīņi 2.5 Pro Experimental jau vada paku, ieņemot galveno vietu Lmarena līderu sarakstā un pārspējot iepriekšējos etalona ierakstus.

AI kopienas reakcija

Cilvēki AI telpā jau ieslēdzas. Daži ir pārsteigti par to, cik labi tā apstrādā sarežģītus matemātikas un kodēšanas uzdevumus. Citi, piemēram, @rishdotblog on X, norādīja, kā modelis, šķiet, “domā” dabiskāk, salīdzinot ar Anthropic’s Claude sēriju.

@Aryanthinks8 to sauca par “dārgakmeni”, un @Chaithanyak42 uzslavēja tā vērtību, saucot Gemini modeļus par “visrentablākajiem” tirgū. Tomēr joprojām ir zināmas bažas. Vienā amatā tika atzīmēts, ka modelis var pārņemt tos pašus aizspriedumus, kas novēroti iepriekšējās AI sistēmās. Google vēl nav piedāvājis pilnīgu informāciju par to, kā tā vēl plāno risināt šīs problēmas.

Kas tālāk?

Gemini 2.5 Pro joprojām tiek marķēts kā eksperimentāls. Google vēlas, lai izstrādātāju un enerģijas lietotāju atsauksmes par reālo pasauli un enerģijas lietotājiem to turpinātu uzlabot. Gaidāmā integrācija Vertex AI, Google Enterprise AI risinājumu platformā, liecina, ka šis modelis ir paredzēts nopietnākiem lietošanas gadījumiem – no programmatūras inženierijas līdz pētniecībai.

Un, ņemot vērā gaidāmo stimulu līdz 2 miljonu marķiera logam, mēs, iespējams, redzēsim jaunas lietojumprogrammas jomās, kurām ir vajadzīgas dziļākas, vairāk konteksta atbildes.

Apakšējā līnija

Gemini 2.5 Pro nav tikai vēl viens AI jauninājums. Tas ir liels lēciens uz priekšu, kā šīs sistēmas apstrādā argumentāciju, kodēšanu un multimediju saturu. Neatkarīgi no tā, vai jūs veidojat instrumentus, pētāt AI modeļus vai vienkārši interesējaties par to, kur atrodas lietas, to ir vērts noskatīties.

Google ziņojums ir skaidrs: šis modelis ir gudrs, pieejams tagad un sākumpunkts tam, kas notiks nākamajā AI.