Vai Nvidia ir nepatikšanās? Tehnoloģiju milži veido savas pielāgotās AI mikroshēmas, lai samazinātu izmaksas un atbrīvotos

Iepriekš šodien Google atklāja Gemma 3-atvērtā koda AI modeļu sēriju, kas darbojas tikai ar vienu GPU vai TPU, kas paredzēts, lai AI izstrāde būtu ātrāka un pieejamāka. Tas ir ass pretstats konkurentiem, piemēram, Deepseek’s 6R1, kas sadedzina desmitiem Nvidia mikroshēmu. Tas ir drosmīgs paziņojums, ka progresējai AI nav obligāti nepieciešama silīcija armija, lai sacenstos.

Bet tas nav tikai Google Flexing – tas ir jaunākais pieaugošajā sacelšanās laikā, kas vairākus mēnešus tiek pagatavots. Iedomājieties ķēniņu uz zelta troņa, viņa bez apstrīdētā silīcija impērija – līdz nemiernieki sāk veidot savus vainagus. Tā ir pašreizējā maiņa AI aparatūras pasaulē.

NVIDIA, ilgstošajam GPU Titan, saskaras ar tādu tehnoloģiju gigantu kā Google, Openai un Meta izaicinājumu, kuri veido savas mikroshēmas, lai samazinātu izmaksas un iegūtu neatkarību no Nvidia dārgās saķeres. Vai NVIDIA valdīšana tiek apdraudēta? Sadalīsim to.

Openai dzirkst uguns februārī

Pirmais streiks piezemējās šī gada sākumā. 2025. gada 5. februārī ziņojumi atklāja, ka Openai tuvojās savas pirmās pielāgotās AI mikroshēmas pabeigšana, kuras mērķis ir samazināt paļaušanos uz Nvidia. Tā nebija blakus esoša kņadas-tā bija skaidra stratēģija, kā uzkurināt viņu nākamā paaudzes modeļus, nenovērtējot Nvidia aparatūru. Uzņēmumam ar milzīgām AI ambīcijām tas bija liels solis. Ja Openai nav nepieciešams Nvidia, kurš to dara?

“Openai virzās uz priekšu ar savu plānu samazināt savu paļaušanos uz Nvidia, izveidojot savas AI mikroshēmas. Paredzams, ka uzņēmums nākamajos mēnešos pabeigs dizainu savai pirmajai pielāgotajai mikroshēmai un nosūtīs to uz Taivānas pusvadītāju ražošanas Co (TSMC) ražošanai. ”

Meta iekļūst cīņā 11. martā

Tikai vakar Meta ielēca sprādzienā. Sociālo mediju gigants sāka pārbaudīt savu pirmo iekšējo AI mikroshēmu, kas paredzēta gan apmācībai, gan secinājumiem, vienlaikus samazinot debesu augstās izmaksas, kas saistītas ar Nvidia GPU. Meta mērķis? Pilnīga kontrole pār savām AI operācijām, nenododot miljardus ārējam piegādātājam. Tas ir aprēķināts gājiens, kas ir daļa no lielākas maiņas – hyperScalers, kas vēlas samazināties no Nvidia orbītas. Meta gadījumā šī mikroshēma ir viņu biļete.

Google šodien parādās karstumu

Mūsdienās Google nometa Gemma 3, un tas ir skaidrs šāviens pāri Nvidia priekšgalam. Kamēr, kā ziņots, DeepSeek 6R1 ir nepieciešami 34 NVIDIA H100 un Meta’s Llama 3 ir vajadzīgi 16, Gemma 3 var darboties tikai ar vienu H100 vai TPU. Tas ir pieejams izmēros no 1 miljarda līdz 27 miljardiem parametru, ar 128 k-takenakta konteksta logu un atbalstu vairāk nekā 140 valodām.

Agrīnie testi liecina, ka tā pārspēj konkurentus, piemēram, LLAMA-405B un Openai O3-Mini. Google ne tikai demonstrē; Viņi norāda uz punktu – Advanced AI nav jānovada miljardiem GPU izdevumos. Tas ir ātrāks, lētāks un pieejamāks uzņēmumiem.

GPU pieprasījuma dilemma

Gemma 3 nav tikai tehnoloģiju pavērsiens – tā ir brīdinājuma zīme NVIDIA biznesa modelim. DeepSeek modeļi vēsturiski balstījās uz desmitiem GPU – 32 H100 R1 un 34 par 6R1, teikts ziņojumos.

Bet Google’s Gemma 3 sasniedz līdzīgus rezultātus tikai ar vienu mikroshēmu. Šis efektivitātes lēciens liecina par nākotni, kurā AI stiprums netiek izmērīts ar GPU skaitu. Openai un Meta pielāgotās mikroshēmas ir daļa no šīs maiņas, bet Google kustība to izvirza priekšplānā.

Ja jauniem modeļiem ir nepieciešams mazāk GPU, lai tie atbilstu vai pārspētu vecākus, pieprasījums pēc Nvidia aparatūras varētu samazināties. Uzņēmumi, jaunuzņēmumi un mākoņu pakalpojumu sniedzēji varētu izvēlēties liesākas iestatījumus, izdarot spiedienu uz Nvidia dominanci. Tas nav tikai par alternatīvu mikroshēmu veidošanu – tas ir par to, lai sāktu mazāk Nvidia mikroshēmu.

Ripple Effect: Amazon, jaunuzņēmumi un liesāki modeļi

Maiņa neaprobežojas tikai ar tehnoloģiju milžiem. Amazon mierīgi progresē savu Trainum mikroshēmu, ko atbalsta tās ieguldījumi antropikā – AI uzņēmumā, kas jau izmanto Google TPU lielākajai daļai tā secinājumu. Arī jaunuzņēmumi, piemēram, Cerebras, pastiprinās, ar specializētām mikroshēmām, kas jaudas modeļos, piemēram, Matlexity Sonar un Mistral’s Chatbot. Tendence virzās uz efektivitāti, nevis brutālu spēku, un tas rada draudus Nvidia premium robežai. Ja Google var palaist Gemma 3 vienā mikroshēmā, kāpēc citiem vajadzētu maksāt par Nvidia aparatūras floti?

Nodarbības no pagātnes: Cisco brīdinājums

Vēsture atbalsojas šeit. Cisco valdīja tīkla pasauli 1990. gados, tā maršrutētāji un slēdži, kas veido interneta mugurkaulu – tāpat kā Nvidia GPU šodien ir AI atslēga. Tomēr 2000. gados konkurenti, piemēram, kadiķis un Arista, ieviesa lētākus, elastīgākus risinājumus, kas atvairīja Cisco dominējošo stāvokli. Cisco adaptēja, bet tā tirgus saķere saruka, jo pircēji deva priekšroku izmaksām un pielāgošanu, kas saistīta ar visu, kas ir piemērota visai impērijai. NVIDIA dominance jūtas līdzīga. Tas šķiet nesatricināms, bet pielāgotas mikroshēmas un efektīvi modeļi varētu būt Nvidia kadiķu brīdis.

NVIDIA tronis kratās

Tirgus izjūt maiņu. NVIDIA krājums šogad ir samazinājies par 15%, lai gan šodien tajā bija 6% atlēciens. Tas ir ass pretstats masīviem izdevumu projektiem, piemēram, Project Stargate vairāku miljardu dolāru datu centra plāniem. Visas acis ir vērstas uz NVIDIA gaidāmo GTC konferenci nākamnedēļ, kur izpilddirektors Jensens Huangs aizstāvēs NVIDIA nostāju. Huangs apgalvo, ka viņu mikroshēmas joprojām vada apmācību un secinājumus, un ekosistēma ir nepārspējama. Bet ekonomika mainās, un pielāgotā silīcija pieaugums ir reāls. NVIDIA premium cenu noteikšanas modelis varētu būt apdraudēts.

Vai tas ir pagrieziena punkts AI aparatūrai?

Šī nav tikai NVIDIA cīņa; Tas ir ieskats AI aparatūras nākotnē. Tā kā nozare pāriet no apmācības uz secinājumiem, efektivitāte kļūst par prioritāti. Openai pielāgotā mikroshēma (termiņa beigām), Meta notiekošie testi un Google atklāšana Gemma 3 parāda pāreju uz neatkarību no NVIDIA. Anthropic jau izmanto Google TPU, un tādi uzņēmumi kā Cerebras gūst panākumus. Izaicinātāji veido impulsu.

Secinājums

NVIDIA vēl nav ārā. Tās ekosistēma joprojām ir masīva, un Huangs nav nepareizi par daudzpusību. Bet tronis vicina. Vai Nvidia ir nepatikšanās? Ne šodien – bet vainaga ir gatava, un tehnoloģiju milži veido savu ceļu. Patiesais jautājums ir: vai Nvidia var noturēt līniju, vai arī tas ir jauna laikmeta sākums AI aparatūrā?

Rakstīšana ir uz Nvidia sienas, un mēs neesam vienīgie, kas to redz. CNBC svars ir tas, ko Google efektīvais “Gemma 3” modelis varētu nozīmēt NVIDIA nākotnei.

https://www.youtube.com/watch?v=tuavhjyympg