OpenAI iepazīstina ar Jalapeño, savu pirmo pielāgoto AI mikroshēmu, kas izveidota ar Broadcom, lai darbinātu ChatGPT un samazinātu secinājumu izmaksas

OpenAI ir izveidojis savu mikroshēmu.

Ceturtdien uzņēmums iepazīstināja ar savu pirmo pielāgoto AI paātrinātāju Jalapeño, kas izstrādāts kopā ar Broadcom kā daļu no plašākas pūles, lai kontrolētu vairāk infrastruktūras aiz ChatGPT, Codex, tā API biznesa un nākamā aģentu AI produktu viļņa. Mikroshēma ir veidota, lai izdarītu secinājumus, dārgu, aprēķinu grūtu atbilžu ģenerēšanas procesu pēc tam, kad modelis jau ir apmācīts. Tam ir nozīme. AI gadījumā par apmācību tiek runāts virsrakstos, taču var secināt, kur krājas rēķini un kur lietotāji patiešām izjūt produktu.

OpenAI Jalapeño ir vairāk nekā aparatūras pavērsiens. Tas ir signāls, ka uzņēmums vēlas lielāku saķeri ar paša AI ekonomiku.

Palaišana ievieš OpenAI dziļāk tajā pašā pielāgotā silīcija sacīkstē, kas jau pārveido nozari. Google ir savi TPU. Amazon ir Trainium un Inferentia. Meta ir pavadījusi gadus, veidojot iekšējo AI aparatūru. Microsoft ir Maija. Tagad OpenAI, kas ilgu laiku tika uzskatīts galvenokārt par modeļu uzņēmumu, publiski pāriet uz mikroshēmu dizainu, jo cīņa par AI vadību pāriet no modeļa kvalitātes vien uz grūtāku jautājumu par to, kurš kontrolē zem tā esošo steks.

Šī kaudze kļūst par īstu kaujas lauku. Mikroshēmas, jauda, datu centri, tīkli, izvietošanas sistēmas un miljardiem uzvedņu apkalpošanas izmaksas sāk būt tikpat svarīgas kā pats modelis. Iesācējiem, kuri skatās mākslīgā intelekta tirgus attīstību reāllaikā, Jalapeño ir vēl viens atgādinājums, ka bizness virzās garām spilgtām demonstrācijām un infrastruktūras karā.

OpenAI laiž klajā savu pirmo AI mikroshēmu Jalapeño, jo tā pāriet, lai kontrolētu vairāk AI Compute Stack

OpenAI izveidoja mikroshēmu kā pirmo paātrinātāju vairāku paaudžu skaitļošanas platformā, ko tas veido kopā ar Broadcom. Uzņēmums teica, ka Jalapeño tika izstrādāts, pamatojoties uz savu viedokli par to, kā attīstīsies liela valodas modeļa secinājumi, koncentrējoties uz to, lai uzlabotu AI padarītu ātrāku, uzticamāku un lētāku apkalpošanu mērogā.

“Mikroshēmas ir AI ekonomikas pamats. Mūsu pašu izveide paplašina mūsu pilno platformu, sākot no produktiem līdz modeļiem un beidzot ar infrastruktūru, un tas palīdzēs mums paplašināt izlūkdatus, apkalpot vairāk cilvēku un paplašināt piekļuvi AI,” teikts OpenAI paziņojumā.

OpenAI izpilddirektoram Semam Altmanam un prezidentam Gregam Brokmanam mikroshēmu pasniedza Broadcom izpilddirektors Hoks Tans un prezidents Čārlijs Kavss, kas ir simboliska nodošana, kas uzsvēra, cik nopietna ir OpenAI, kas vēlas iegūt vairāk savas infrastruktūras nākotnes.

Uzņēmums jau vairākus mēnešus ir devis mājienus par šo virzienu. Reuters iepriekš ziņoja, ka OpenAI sadarbojās ar Broadcom, lai izveidotu pielāgotu mikroshēmu, lai izdarītu secinājumus, lai samazinātu tā atkarību no ierobežotajiem, dārgajiem GPU. Ceturtdienas paziņojums apstiprina šos centienus un piešķir tiem nosaukumu, ceļvedi un daudz skaidrāku stratēģisko mērķi.

OpenAI saka, ka Jalapeño tika izveidots no nulles, ņemot vērā darba slodzi, kas ir vissvarīgākā tās uzņēmējdarbībai. Tas ietver ChatGPT, Codex, tā API platformu un turpmākos AI aģentus. Uzņēmums teica, ka dizainu veidoja tā iekšējās zināšanas par modeļu kodoliem, apkalpošanas sistēmām, atmiņas kustību, tīkla prasībām un veidu, kā robežlīnijas LLM uzvedas reālās ražošanas slodzēs. Broadcom apstrādāja silīcija ieviešanu un nodrošināja tīkla tehnoloģijas, tostarp tās Tomahawk tīkla silīciju, savukārt Celestica palīdzēja ar dēļu, plauktu un sistēmas līmeņa integrāciju.

Saskaņā ar OpenAI, tostarp GPT-5.3-Codex-Spark, inženiertehniskie paraugi laboratorijā jau izmanto mašīnmācīšanās darba slodzes ar ražošanas mērķa frekvenci un jaudu. Uzņēmums vēl nav izlaidis etalonskaitļus, taču teica, ka agrīnās pārbaudes liecina, ka Jalapeño vajadzētu nodrošināt ievērojami labāku veiktspēju uz vatu nekā pašreizējām modernajām sistēmām. Detalizēts tehniskais ziņojums ir gaidāms tuvāko mēnešu laikā.

Šis apgalvojums par veiktspēju uz vatu ir liels. Tas attiecas tieši uz galveno problēmu, ar kuru saskaras AI nozare: kā turpināt apkalpot viedākus modeļus, neļaujot izmaksu aprēķināšanai nekontrolējami. Secinājums ir tas, kur AI uzņēmumi tērē lielas naudas summas, tiklīdz produkti sasniedz mērogu. Labāka secinājumu mikroshēma var nozīmēt ātrāku reakciju, zemākas darbības izmaksas, paredzamāku jaudu un mazāku atkarību no ārējiem piegādātājiem. OpenAI gadījumā tas varētu nozīmēt lētākus API izsaukumus, labāku darbspējas laiku pieprasījuma pieauguma laikā un vairāk vietas uzlaboto modeļu ieviešanai galvenajos produktos.

“Pasaule pāriet uz ekonomiku, kas balstīta uz skaitļošanu,” sacīja Gregs Brokmens, OpenAI prezidents un līdzdibinātājs. “Jalapeño ir daļa no mūsu ilgtermiņa pilnas skursteņa infrastruktūras stratēģijas, lai padarītu aprēķinus daudz plašākus, tādējādi radot AI, kas ir ātrāks, uzticamāks, pieejamāks cilvēkiem un uzņēmumiem, un to var izmantot svarīgāku problēmu risināšanai. Paši projektējot vairāk informācijas, mēs varam nodrošināt lielāku inteliģenci ar lielāku efektivitāti un turpināt virzīt progresīvu AI uz plašāku piekļuvi.”

Ričards Ho, kurš vada OpenAI aparatūras programmu, sacīja, ka mikroshēma ir optimizēta specifiskām vājajām vietām, kas rodas liela mēroga secinājumos.

“Jalapeño tika izstrādāts no paša sākuma, lai izdarītu LLM secinājumus, izmantojot detalizētu ieskatu mūsu ciešajā sadarbībā ar OpenAI pētniekiem,” sacīja Ho. “Mēs optimizējām kodolu arhitektūru, atmiņas kustību, tīklu veidošanu un apkalpošanas modeļus, kas ir vissvarīgākie AI modeļiem. Pamatojoties uz agrīno testēšanu, Jalapeño efektīvi izpildīs mūsu vissvarīgākās darba slodzes tuvu aparatūras teorētiskajām robežām.”

Broadcom pozicionē projektu kā sākumu kaut kam daudz lielākam par vienreizēju mikroshēmu.

“Mūsu sadarbība ar OpenAI ir būtiska apņemšanās paplašināt fizisko infrastruktūru, kas nepieciešama nākamajai AI desmitgadei,” sacīja Hoks Tans, Broadcom prezidents un izpilddirektors. “Šis ir tikai sākums vairāku paaudžu ceļvedim. Kopā ar mūsu nozarē vadošo silīciju tieši kopā ar OpenAI, mēs nodrošinām gigavatu mēroga datu centru izvietošanu kopā ar Microsoft un citiem partneriem, sākot no 2026. gada.”

OpenAI saka, ka Jalapeño nav pārveidots paātrinātājs, kas pielāgots vecākām AI darba slodzēm. Tajā mikroshēma ir aprakstīta kā tukšs dizains mūsdienu LLM secinājumiem, kas izstrādāts lielu modeļu caurlaidspējai, bet ar pietiekami zemu latentumu interaktīviem produktiem. Šai atšķirībai ir nozīme. Apmācības mikroshēmas un secinājumu mikroshēmas veic dažādus darbus, un uzņēmumi, kas uzvar AI, var būt tie, kas pārstāj uzskatīt visus aprēķinus par savstarpēji aizstājamiem.

OpenAI pirmā pielāgotā mikroshēma norāda uz dziļāku spiedienu, lai kontrolētu AI secinājumu izmaksas, ātrumu un mērogu

Mikroshēma ir daļa no lielākas pilnas kaudzes stratēģijas, ko OpenAI tagad skaidri parāda. Uzņēmums vēlas vairāk veidot ceļu starp neapstrādātu silīciju un galalietotāja pieredzi. Tas ietver mikroshēmu arhitektūru, apkalpošanas programmatūru, atmiņas sistēmas, tīklu izveidi, plānošanu, izvietošanas infrastruktūru un produktus, ko šīs sistēmas atbalsta. Jo ciešāk šie slāņi ir savienoti, jo efektīvāk OpenAI var darbināt savus modeļus, un konkurentiem kļūst grūtāk saskaņot veiktspēju ar izmaksām.

OpenAI saka, ka Jalapeño no sākotnējā projektēšanas līdz lentes ražošanai deviņu mēnešu laikā, uzņēmums raksturo kā vienu no ātrākajiem ASIC izstrādes cikliem, kāds jebkad sasniegts uzlabotajos pusvadītājos. Tas nosaka ātrumu ciešai sadarbībai starp OpenAI inženieriem un Broadcom, kā arī pašu OpenAI modeļu izmantošanu, lai paātrinātu mikroshēmu projektēšanas un optimizācijas procesa daļas.

Šī detaļa var būt viena no interesantākajām stāsta daļām. OpenAI faktiski saka, ka AI palīdzēja izveidot aparatūru, kas darbosies nākotnē. Ja šī atgriezeniskā saite turpināsies, tam var būt daudz vairāk nekā vienas mikroshēmas palaišanas. Ātrāka mikroshēmu izstrāde nozīmē ātrāku infrastruktūras atkārtojumu. Ātrāka infrastruktūras atkārtošana nozīmē zemākas aprēķinu izmaksas un īsāku ceļu no modeļa izpētes līdz izvietojamiem produktiem.

Paredzams, ka Jalapeño būs pirmais bloks plašākā skaitļošanas platformā, kuru sākotnēji plānots ieviest līdz 2026. gada beigām. OpenAI saka, ka nākamās paaudzes apvienos paša izstrādātos paātrinātājus ar Broadcom silīcija un tīkla tehnoloģiju un Celestica sistēmu pieredzi.

Lietotājiem nekas no tā nebūs nozīmes, ja tas neparādīsies produktā. OpenAI piķis ir tāds, ka tas būs. Labāka secinājumu kopa var nozīmēt ātrākas ChatGPT atbildes, AI kodēšanas rīkus, kas veic vairāk darbību bez apstāšanās, lētāku API piekļuvi izstrādātājiem un uzticamāku pakalpojumu, kad pieprasījums pieaug. Tā ir infrastruktūras sacensību praktiskā puse. Pati mikroshēma var atrasties dziļi datu centra iekšienē, taču mērķis ir padarīt AI justies lētāku, ātrāku un pieejamāku uz virsmas.

Lielāku līdzņemamo ēdienu ir grūtāk palaist garām. AI vadība vairs nav saistīta tikai ar to, kuram ir visgudrākais modelis. Runa ir par to, kurš var atļauties izmantot šo modeli plašā mērogā, kurš var saglabāt zemu latentumu, kurš var pārdzīvot GPU deficītu un kurš var neļaut izsecināt izmaksām aprīt biznesu. OpenAI pirmā pielāgotā mikroshēma to visu neatrisina vienas nakts laikā. Tas parāda, kur uzņēmums uzskata, ka tiks uzvarēts nākamais AI sacensību posms.