DeepSeek klusi izlaiž modernizētu R1 AI modeli, palielinot konkurenci ar Openai

Tikai dažus mēnešus pēc tam, kad tas nosūtīja triecienviļņus caur tehnoloģiju industriju, ķīniešu AI Startup DeepSeek ir atkal ar vēl vienu pārsteigumu – šoreiz tas neizraisīja skaņu.

Bez oficiāla paziņojuma vai plašsaziņas līdzekļu spiediena DeepSeek klusi augšupielādēja modernizētu tā argumentācijas modeļa versiju, lai apskautu Face – publisku AI repozitoriju. Tas ir jaunākais uzņēmuma solis, kas šā gada sākumā veidoja virsrakstus pēc tam, kad sākotnējais R1 modelis pārspēja tādus smagsvarus kā Meta un Openai.

Atkal DeepSeek streiki: ķīniešu AI Startup klusi izlaiž jaunu R1 modeli ar vibe kodēšanas atbalstu

Janvārī DeepSeek pārspēja Chatgpt, lai kļūtu par visaugstāk novērtēto bezmaksas lietotni Apple App Store ASV tā 10. janvāra atklāšanā, izmantojot tehnoloģiju nozari, tika nosūtīti ripples. DeepSeek atvērtā koda modelis ne tikai pārspēja savu svaru-tas notika ar niecīgu budžetu un rekordīsā laikā. Rezultāts? Panika pāri tirgiem, asi jautājumi par AI izdevumiem ASV un pagaidu trieciens investoru uzticībai lielākajiem AI spēlētājiem, ieskaitot Nvidia. Kamēr tirgi lielākoties ir atgriezušies, Deepseeka pieaugums kalpoja kā modināšanas zvans.

Tagad šeit ir modernizētais R1 modelis – un atkal tas lido zem radara.

Pēc DeepSeek teiktā, modernizētais modelis ir devis spēcīgus rezultātus starp etaloniem matemātikā, kodēšanā un argumentācijā, ievietojot to pārsteidzošā attālumā no labākajiem izpildītājiem, piemēram, Openai O3 un Gemini 2.5 Pro.

“DeepSEEK R1 modelim ir veikts neliels versijas jauninājums, un pašreizējā versija ir DeepSEEK-R1-0528. Jaunākajā atjauninājumā DeepSeek R1 ir ievērojami uzlabojis tā spriešanas un secinājumu spēju dziļumu, izmantojot palielinātu skaitļošanas resursus un ieviešot algoritmisko optimizācijas mehānismu ieviešanu,” sacīja DeepSeek.

DeepSeek R1 jaunā versija atrodas tieši aiz Openai O4-Mini un O3 LivecodeBench-etalonuzdevumu vietnes, kas novērtē spriešanas iespējas lielās valodas modeļos. Šāda veida modeļi ir izstrādāti, lai apstrādātu sarežģītākus uzdevumus, izmantojot loģisku, soli pa solim.

Deepseek rakstīja ierakstā par huggingface: ”

Salīdzinot ar iepriekšējo versiju, modernizētais modelis parāda ievērojamus uzlabojumus sarežģītu spriešanas uzdevumu apstrādē. Piemēram, AIME 2025 testā modeļa precizitāte iepriekšējā versijā ir palielinājusies no 70% līdz 87,5% pašreizējā versijā. Šis progress izriet no pastiprināta domāšanas dziļuma spriešanas procesa laikā: AIME testa komplektā iepriekšējā modelī tika izmantoti vidēji 12K marķieri vienā jautājumā, turpretī jaunā versija vidēji ir 23K marķieri vienā jautājumā. Papildus uzlabotajām spriešanas iespējām šī versija piedāvā arī samazinātu halucinācijas ātrumu, uzlabotu atbalstu funkciju izsaukšanai un labāku pieredzi vibe kodēšanai.

DeepSeek ātri ir kļuvis par Ķīnas pieaugošās klātbūtnes simbolu AI. Un tas to dara arvien stingrākiem ierobežojumiem. ASV ir ierobežojušas Ķīnas piekļuvi augstākās klases mikroshēmām, cerot ierobežot tā progresu. Bet līdz šim šī likme neatmaksā.

Tikai šomēnes Tech Giants Baidu un Tencents dalījās ar atjauninājumiem par to, kā viņi padara savus modeļus efektīvākus – daļēji kā veids, kā apiet aparatūras ierobežojumus, ko rada ASV eksporta kontrole.

NVIDIA izpilddirektors Jensens Huangs neatturēja savus nesenos komentārus par šo jautājumu.

“ASV savu politiku ir balstījusi uz pieņēmumu, ka Ķīna nevar izgatavot AI mikroshēmas,” sacīja Huangs. “Šis pieņēmums vienmēr bija apšaubāms, un tagad tas ir acīmredzami nepareizi,” ziņoja CNBC.

“Jautājums nav par to, vai Ķīnai būs AI,” viņš piebilda. “Tas jau notiek.”

DeepSeek klusā jaunā modeļa ieviešana varētu šķist smalka, taču tā vēstījums ir skaļš un skaidrs: Ķīna negaida atļauju. Tā ir ēka.

🚀 Vai vēlaties, lai jūsu stāsts būtu redzams?

Iegūstiet tūkstošiem dibinātāju, investoru, PE firmas, tehnoloģiju vadītāju, lēmumu pieņēmēju un tehnoloģiju lasītāju priekšā, iesniedzot savu stāstu Techstarts.comApvidū

Piedāvājiet