Z.ai atvērtā koda GLM-5.2 pārspēj GPT-5.5 kodēšanas etalonos par vienu sesto daļu no izmaksām

753 miljardu parametru modelis vairākos programmatūras inženierijas etalonos pārsniedza GPT-5.5, piedāvā 1 miljona marķiera konteksta logu un ir pieejams ar neierobežotu MIT licenci.

Kopš ChatGPT darbības uzsākšanas 2022. gada novembrī mākslīgā intelekta nozares visspējīgākie modeļi lielākoties nākuši no nelielas labi finansētu amerikāņu laboratoriju grupas. Atvērtā pirmkoda konkurenti ir samazinājuši atšķirību, tomēr tie reti ir pārsnieguši līderus kritērijos, kas programmatūras izstrādātājiem ir vissvarīgākie.

Tagad Z.ai atvērtā koda GLM-5.2 var būt viens no pirmajiem, kas to mainīs.

Šodien ķīniešu mākslīgā intelekta starta uzņēmums Z.ai, agrāk pazīstams kā Zhipu AI, paziņoja par GLM-5.2, 753 miljardu parametru atvērtā svara lielas valodas modeļa izlaišanu, kas izstrādāts ilgtermiņa autonomai kodēšanai un inženierijas uzdevumiem.

“Mēs ieviešam GLM-5.2, mūsu jaunāko vadošo modeli ilgtermiņa uzdevumiem. Tas iezīmē būtisku lēcienu ilgtermiņa uzdevumu iespējās salīdzinājumā ar tā priekšgājēju GLM-5.1 un pirmo reizi nodrošina šo iespēju stabilā 1M marķiera kontekstā,” emuāra ierakstā teica Z.ai.

GLM-5.2, kas izlaists, izmantojot Hugging Face, Z.ai API un vairāk nekā 20 trešo pušu kodēšanas vidi, ir pieejams ar ļoti stabilu 1 miljona marķiera konteksta logu un cenām, kas ir zemākas par daudziem vadošajiem patentētajiem modeļiem. Uzņēmums saka, ka modelis pārspēja OpenAI GPT-5.5 vairākos programmatūras inženierijas etalonos, vienlaikus maksājot aptuveni vienu sesto daļu no ekspluatācijas.

Palaišana iezīmē vēl vienu pavērsienu arvien pieaugošajās sacīkstēs starp atvērtajiem un slēgtajiem AI modeļiem. Pēdējo divu gadu laikā tādi uzņēmumi kā OpenAI, Anthropic un Google ir dominējuši AI etalonu reitingu augšgalā. Atvērtā pirmkoda modeļi ir nepārtraukti uzlabojušies, lai gan tikai daži ir sasnieguši spēcīgākās patentētās sistēmas sarežģītu kodēšanas un ilgtermiņa inženierijas uzdevumu veikšanai.

GLM-5.2 pārspēj GPT-5.5 kodēšanas etalonos par zemākām izmaksām

Tehniskajā ierakstā, kas pievienots palaišanai, Z.ai aprakstīja GLM-5.2 kā tā līdz šim spējīgāko modeli darbam ilgtermiņā.

Uzņēmums paziņoja, ka modelī ir ieviesti vairāki būtiski uzlabojumi, tostarp stabils 1 miljona marķieru konteksta logs, spēcīgāka kodēšanas veiktspēja ar regulējamiem argumentācijas piepūles līmeņiem un arhitektūras optimizācija, kas paredzēta, lai uzlabotu efektivitāti ārkārtējos konteksta garumos.

Paziņojumā uzsvērts izaicinājums, kas kļuvis arvien svarīgāks, jo AI kodēšanas aģenti kļūst arvien spējīgāki. Liela konteksta loga pieņemšana ir salīdzinoši vienkārša. Daudz grūtāk ir saglabāt veiktspēju un konsekvenci visu stundu inženierdarbu, atkļūdošanas sesiju, pētniecības projektu un liela mēroga programmatūras ieviešanas laikā.

Lai risinātu šo problēmu, Z.ai teica, ka tas ievērojami paplašināja ilgtermiņa apmācību, koncentrējoties uz kodēšanas aģentu scenārijiem, tostarp automatizētu izpēti, programmatūras ieviešanu, veiktspējas optimizāciju un sarežģītiem atkļūdošanas uzdevumiem.

Uzņēmums apgalvo, ka rezultāts ir modelis, kas spēj nodrošināt veiktspēju visās paplašinātās inženierijas darbplūsmās, nevis vienkārši atbalsta lielāku marķiera ierobežojumu uz papīra.

Etalona rezultāti liecina, ka GLM-5.2 pārspēj GPT-5.5

Z.ai apgalvojumus atbalsta virkne etalonu rezultātu, kas šo modeli ierindo starp spēcīgākajām kodēšanas AI sistēmām, kas pašlaik ir pieejamas.

SWE-bench Pro, etalonā, kas novērtē reālās pasaules programmatūras inženierijas uzdevumus, GLM-5.2 sasniedza 62,1 punktu, pārspējot GPT-5.5 punktu skaitu 58,6.

Modelis īpaši labi darbojās FrontierSWE, etalonā, kas izstrādāts, lai novērtētu AI aģenta spēju pabeigt ilgtermiņa tehniskus projektus. GLM-5.2 ieguva 74,4%, apsteidzot GPT-5.5 72,6% un tieši aiz Anthropic Claude Opus 4,8, kas ieguva 75,1%.

Saskaņā ar Z.ai teikto, GLM-5.2 atpaliek no Opus 4.8 tikai par vienu procentpunktu FrontierSWE, vienlaikus pārspējot GPT-5.5 un Opus 4.7.

Uzņēmums uzsvēra papildu ieguvumus PostTrainBench, etalonā, kas novērtē, vai AI aģenti var uzlabot mazākus modeļus, izmantojot pēcapmācību. GLM-5.2 ierindojās tikai aiz Claude Opus 4.8 un pārspēja GPT-5.5 un Opus 4.7.

SWE-Marathon, kas koncentrējas uz īpaši gariem programmatūras inženierijas uzdevumiem, piemēram, kompilatoru izveidi, kodolu optimizēšanu un ražošanas līmeņa pakalpojumu izstrādi, GLM-5.2 joprojām bija visaugstāk novērtētais atvērtā pirmkoda modelis, lai gan tas joprojām atpalika no Claude Opus 4.8.

Modelis sniedza spēcīgus rezultātus arī citos novērtējumos.

MCP-Atlas, etalonā, kas mēra rīku lietošanas iespējas, GLM-5.2 ieguva 77,0, salīdzinot ar GPT-5.5 75,3.

Cilvēces pēdējā eksāmenā ar iespējotiem rīkiem GLM-5.2 ieguva 54,7 punktus, apsteidzot GPT-5.5 52,2.

Modelis arī nodrošināja pirmo vietu kolektīvā Design Arena etalonā ar ELO punktu skaitu 1360, pārspējot Klodu Fable 5.

Šajos novērtējumos GLM-5.2 konsekventi tika ierindots kā visefektīvākais atvērtā pirmkoda modelis, un tas bieži atbilst vai pārsniedza vadošo patentēto sistēmu veiktspēju.

Kāpēc ilgtermiņa kodēšanas uzdevumi ir svarīgi?

Liela daļa AI kodēšanas palīgu uzmanības ir pievērsta koda fragmentu ģenerēšanai vai atsevišķu kļūdu labošanai.

Gara horizonta inženiertehniskie uzdevumi ir dažādi.

Šīm darba slodzēm bieži ir nepieciešama AI sistēma, lai pārvaldītu lielas kodu bāzes, koordinētu vairākus izstrādes soļus, saglabātu kontekstu ilgākā laika posmā un pabeigtu projektus, kas var aizņemt stundas vai pat dienas.

Šis izaicinājums ir kļuvis par vienu no svarīgākajiem mūsdienu kodēšanas aģentu testiem.

Saskaņā ar Z.ai teikto, GLM-5.2 paplašinātā apmācība viena miljona žetonu konteksta garumā bija īpaši vērsta uz šiem scenārijiem. Uzņēmums saka, ka modelis tika apmācīts, lai atbalstītu liela mēroga ieviešanas projektus, automatizētas izpētes darbplūsmas, optimizācijas pasākumus un sarežģītus atkļūdošanas vingrinājumus.

Etalona rezultāti liecina, ka ieguldījumi, iespējams, ir atmaksājušies.

Arhitektūras iekšpusē, kas darbina GLM-5.2

Zem pārsega GLM-5.2 ievieš vairākas arhitektūras izmaiņas, kuru mērķis ir uzlabot efektivitāti un veiktspēju ilgā kontekstā.

Viena no ievērojamākajām ir jauna pieeja, ko sauc par IndexShare.

Tradicionālie lielo valodu modeļi veic atkārtotus uzmanības aprēķinus milzīgam informācijas daudzumam. Šīs darbības kļūst arvien dārgākas, jo konteksta logi kļūst lielāki.

Z.ai saka, ka IndexShare atkārtoti izmanto vienu un to pašu indeksētāju visos četros mazās uzmanības slāņos.

Pēc uzņēmuma domām, šī pieeja samazina katra marķiera peldošā komata darbības aptuveni 2,9 reizes, ņemot vērā modeļa maksimālo viena miljona marķiera konteksta garumu.

GLM-5.2 arī ievieš uzlabojumus tā Multi-Token Prediction slānī spekulatīvai dekodēšanai.

Uzņēmums saka, ka šīs izmaiņas palielina pieņemto marķiera garumu secinājuma laikā līdz pat 20%.

Izstrādātāji var izvēlēties starp vairākiem argumentācijas režīmiem atkarībā no viņu prioritātēm.

Iestatījums “Max” piešķir prioritāti sarežģītu uzdevumu maksimālai spriešanas veiktspējai.

Iestatījums “Augsts” nodrošina līdzsvaru starp veiktspēju, latentumu un marķiera patēriņu.

Z.ai etalona dati liecina, ka augstais režīms saglabā lielāko daļu modeļa veiktspējas, vienlaikus ievērojami samazinot izvades marķiera izmantošanu.

Pierobežas līmeņa kodēšanas AI par vienu sesto daļu no izmaksām

Izrāde ir tikai daļa no stāsta.

Ekonomika var izrādīties tikpat pārliecinoša.

Z.ai iekasē USD 1,40 par miljonu ievades marķieru un USD 4,40 par miljonu izvades marķieru, tādējādi kopējās izmaksas sasniedz USD 5,80 par miljonu marķieru.

Salīdzinājumam, GPT-5.5 maksā USD 5,00 par miljonu ievades marķieru un USD 30,00 par miljonu izvades marķieru, kopā 35 USD par miljonu marķieru.

Tas nozīmē, ka GLM-5.2 nodrošina salīdzināmu kodēšanas veiktspēju par aptuveni vienu sesto daļu no izmaksām.

Uzņēmums arī piedāvā kešatmiņas ievades ātrumu tikai USD 0,26 par miljonu marķieru ilgstošai darba slodzei, kā arī ierobežota laika reklāmu, kas nodrošina bezmaksas kešatmiņas ievades krātuvi.

Cenu atšķirība ir piesaistījusi uzmanību AI izstrādātāju kopienā.

Vairāki novērotāji atzīmēja, ka atvērtā svara modeļi arvien vairāk nodrošina robežlīmeņa veiktspēju bez augstākās cenas noteikšanas, kas saistīta ar daudzām patentētām sistēmām.

MIT licence varētu būt tikpat svarīga kā etalona rādītāji

Iespējams, ka visvairāk traucējošais izlaiduma aspekts nav etalona veiktspēja vai cenas.

Tā var būt licence.

Z.ai izlaida GLM-5.2 saskaņā ar neierobežotu MIT atvērtā pirmkoda licenci.

Tas nozīmē, ka uzņēmumi var lejupielādēt modeļu svarus, modificēt tos, precizēt sistēmu, izvietot to iekšējā infrastruktūrā un komercializēt produktus, kas izveidoti uz tā pamata, bez autoratlīdzības vai ierobežojošām pārvaldības prasībām.

Uzņēmums modeli raksturo kā “Pure Open”, uzsverot, ka licence neuzliek reģionālus ierobežojumus un nodrošina neierobežotu tehnisko piekļuvi.

Uzņēmumiem, kurus uztrauc pārdevēju bloķēšana, datu suverenitāte, regulējuma nenoteiktība vai ģeogrāfiskās piekļuves ierobežojumi, šī elastība varētu izrādīties pievilcīga.

Izlaidums tiek publicēts laikā, kad piekļuve dažiem AI modeļiem ir arvien vairāk saistīta ar regulējošiem un eksporta kontroles apsvērumiem.

Atvērtais modelis, ko organizācijas var uzņemt pašas, piedāvā citu ceļu.

Izstrādātāji reaģē uz GLM-5.2 palaišanu

Izstrādātāju reakcija bija tūlītēja.

Cline IDE slavēja izlaidumu vietnē X, rakstot:

“GLM-5.2 ir pirmais atvērtā svara modelis, kas pārsniedz 80% uz Terminal-Bench, un pārspēj visus citus pieejamos atvērtos modeļus.”

Komanda piebilda, ka modelis pārspēja Gemini un raksturoja to kā robežlīmeņa modeli, kas pieejams par nelielu daļu no izmaksām.

Kilo Code paziņoja par pirmās dienas integrācijas atbalstu, izceļot modeļa viena miljona marķiera konteksta logu un Max argumentācijas režīmu.

Uzņēmums uzsāka savu GLM kodēšanas plānu līdztekus izlaišanai.

Lite plāna cena sākas no 12,60 USD mēnesī, Pro cena palielinās līdz 50,40 USD mēnesī un sasniedz 112 USD mēnesī Max līmenim.

Plāni atbalsta trešo pušu kodēšanas rīkus, tostarp Claude Code, OpenClaw, Cline, Kilo Code, Crush un Factory.

Ko GLM-5.2 nozīmē atvērtā koda AI sacīkstēm

Lielāko daļu ģeneratīvā AI laikmeta patentētie modeļi ir saglabājuši skaidru pārsvaru pār atvērtā pirmkoda konkurentiem.

Šis pārsvars ir nepārtraukti samazinājies.

GLM-5.2 ir viens no spēcīgākajiem atvērtā svara modeļa piemēriem, kas tieši konkurē ar robežām patentētām kodēšanas un programmatūras inženierijas darba slodzēm.

Jāskatās, vai modelis var saglabāt šo pozīciju, jo OpenAI, Anthropic, Google, DeepSeek un citi izstrādātāji izlaiž jaunas sistēmas.

Pagaidām Z.ai ir sniedzis vēstījumu, ko daudzi atvērtā pirmkoda kopienā ir gaidījuši: robežlīmeņa kodēšanas AI vairs nav ekskluzīva slēgtiem modeļiem.