Openai nākamajos mēnešos plāno izlaist jaunu “atvērtā svara” valodas modeli ar argumentāciju

Openai paziņoja par plāniem izlaist savu pirmo atvērtā svara valodas modeli ar spriešanas iespējām kopš GPT-2. Izpilddirektors Sems Altmans dalījās atjauninājumā pirmdien, sakot, ka modelis varētu būt pieejams nākamajos mēnešos – varbūt pat līdz vasarai.

Tas iezīmē lielas izmaiņas Openai virzienā. Pēc gadiem ilgākos vismodernākos modeļus aiz slēgtām API un abonēšanas uzņēmums atkal atver savas durvis. Ar iebūvēto argumentāciju šis jaunais modelis nav saistīts tikai ar teksta ģenerēšanu – tas bija domāts, lai pārdomātu problēmas, izveidotu loģiskus savienojumus un sniegtu strukturētas atbildes.

Altmans sacīja, ka modelis pirms palaišanas izies Openai iekšējā novērtēšanas procesā, tāpat kā jebkurš cits izlaidums. Bet šoreiz viņi pievieno vairāk čeku, pilnībā zinot, ka modelis tiks modificēts, kad tas būs ārā savvaļā.

“TL; DR: Mēs ar prieku izlaižam jaudīgu jaunu atvērtā svara valodas modeli ar argumentāciju nākamajos mēnešos, un mēs vēlamies runāt ar Devs par to, kā padarīt to maksimāli noderīgu,” Altmans dalījās ar X.

Šis ir diezgan liels Openai brīdis. Kopš GPT-2 izlaišanas 2019. gadā, uzņēmums ir saglabājis saspringtu vāku saviem jaunākajiem modeļiem, piedāvājot piekļuvi tikai caur API vai apmaksātiem abonementiem. Šoreiz lietas ir savādāk. Gaidāmais modelis būs lejupielādējams un modificējams – maiņa, kas varētu pulcēties pa AI telpu.

“Mēs par to jau ilgu laiku domājām, bet citām prioritātēm bija prioritāte,” rakstīja Altmans. “Tagad ir svarīgi darīt.” Viņš piebilda, ka modelis tiks palaists caur Openai sagatavotības ietvaru pirms palaišanas, un atzina, ka komanda veic papildu sagatavošanas darbu, pilnībā zinot, ka izstrādātāji to modificēs, kad tas būs beidzies.

Openai sāk lietas ar izstrādātāju pasākumiem Sanfrancisko, kam seko sesijas visā Eiropā un Āzijas un Klusā okeāna reģionā. Mērķis ir apkopot atgriezenisko saiti, pārbaudīt agrīnos prototipus un labāk saprast, kā izstrādātāji vēlas izmantot modeli, pirms tas oficiāli palaiž.

“Mēs priecājamies redzēt, ko izstrādātāji veido un kā lieli uzņēmumi un valdības to izmanto tur, kur viņi izvēlas pašiem vadīt modeli,” piebilda Altmans.

Kāds ir atvērtā svara modelis?

Atvērtā svara modelis dod izstrādātājiem tiešu piekļuvi neironu tīkla iekšējiem parametriem-pamatīgi “iekšas”, kā tas darbojas. Atšķirībā no mākoņa bāzes modeļiem, kurus jūs vaicājat caur API, šos modeļus var lejupielādēt un palaist uz vietas vai uz pielāgotas infrastruktūras. Tas padara tos elastīgākus, lētākus lietošanai mērogā un vieglāk pielāgot īpašiem lietošanas gadījumiem.

Padomājiet par to, piemēram, piekļuvi avota kodam, nevis bloķētai lietotnei. Jūs ne tikai izmantojat modeli – jūs varat to pārveidot, cik vēlaties.

Kāpēc tagad?

Šī lēmuma vadīšana nav tikai nostalģija, lai vadītu GPT-2. Tirgus ir mainījies. Meta tika sākta 2023. gadā ar savu lamu modeli, un kopš tā laika citi spēlētāji, piemēram, Deepseek, ir ielēcuši ar savām atvērtā svara alternatīvām. Jo īpaši DeepSeek R1 modelis pievērsa uzmanību, lai piedāvātu spēcīgu sniegumu par nelielu daļu no lielāku Rietumu modeļu izmaksām.

Altmans nav kautrējies atzīt maiņu. Laiks, viņš saka, tagad jūtas pareizi. Arī šeit loma ir konkurences spiedienam. Openai ir izveidojis nosaukumu premium AI produktiem, taču ir grūti ignorēt atvērtā pirmkoda alternatīvas.

Atvērtā modeļa izlaišana nav tikai solis palikt aktuālam-tas ir solis ceļā uz ietekmes atgūšanu AI ekosistēmas daļā, kuru uzņēmums kādreiz palīdzēja definēt.

Ko izstrādātāji var sagaidīt

Openai aicina izstrādātājus piedalīties procesā. Izmantojot gaidāmos pasākumus un speciālu agrīnas piekļuves lapu, uzņēmums mēģina saprast, kas lietotājiem patiesībā ir nepieciešams, un to veido.

Šī pieeja varētu radīt reālas pārmaiņas. Ļaujot izstrādātājiem palaist modeļus uz vietas, Openai dod mazākām komandām un organizācijām iespēju būvēt, nepaļaujoties uz dārgiem trešo personu rīkiem. Sākot no jaunizveidotiem uzņēmumiem līdz universitātēm un beidzot ar valsts institūcijām, iespējas stiepjas tālu un plaši.

Un izstrādātājiem ir vairāk nekā izmaksu ietaupījums. Atvērtā svara modeļus var precīzi noregulēt īpašiem uzdevumiem un integrēt pielāgotajās darbplūsmās, ko ir grūtāk izdarīt ar ieslēgtām mākoņu API. Jūs saņemat brīvību un kontroli – divas lietas, kas izstrādātāji mēdz daudz novērtēt.

Daži riski sajaukumā

Tomēr tas nav viss gluda burāšana. Kad tāds modelis kā šis ir pieejams savvaļā, kontrole kļūst sarežģītāka. Openai ir tikusi galā ar savu taisnīgo daļu no rūpīgajām rūpnīcām – oficiālu tiesas prāvām, satura mērenības izaicinājumiem un bažām par nepareizu izmantošanu. Modelis, kas var būt labāks par iepriekšējām versijām, varētu radīt jaunus jautājumus par drošību un atbildību.

Ir arī konkurence. Piemēram, DeepSeek R1 jau ir atzīts par ātrumu un rentabilitāti. Ja Openai vēlas, lai izstrādātāji uztver šo izlaidumu nopietni, ir jāpierāda, ka tas nav tikai jaudīgs, bet arī vērts pārslēgties – it īpaši lietotājiem, kuri cieši vēro veiktspējas etalonus.

Raugoties uz priekšu

Kopš 2025. gada 31. marta visas acis ir uz Openai. Šis gaidāmais modelis varētu iezīmēt pārmaiņu par to, kā uzņēmums sadarbojas ar plašāku tehnoloģiju kopienu, un kā izstrādātāji veidojas ar AI.

Likmes ir augstas, bet arī satraukums. Daudz kas ir atkarīgs no izpildes, caurspīdīguma un no tā, vai Openai var līdzsvarot atvērtību ar atbildību.

Altmans to teica vislabāk: “Tagad ir svarīgi darīt.”Ja viņi to novilks, šī izlaidums galu galā varētu būt viena no ietekmīgākajām lietām, ko Openai ir izdarījusi gadu laikā.

Vasara nav tālu – un, ja tā nolaižas tā, kā tā tiek gaidīta, tā varētu būt liela.