Meta AI panikas režīmā, jo bezmaksas atvērtā avota dziļums iegūst vilci un pārspēj daudz mazāk

Pagājušā gada beigās mēs ziņojām par ķīniešu AI startup, kas pārsteidza nozari, atklājot DeepSeek, atvērtā koda AI modeli, kas lepojas ar 685 miljardiem parametru. Tas, kas veidoja virsrakstus, ne tikai tā mērogs, bet arī veiktspēja – tas pārspēja Openai un Meta jaunākos modeļus, vienlaikus izstrādājot par nelielu daļu no izmaksām.

DeepSeek vispirms piesaistīja mūsu uzmanību pēc tam, kad CNBC ziņojumā atklājās, ka tā DeepSeek V3 modelis ir pārspējis Meta Llama 3.1, Openai GPT-4O un Alibaba Qwen 2.5 trešās puses etalonos. Startup iztērēja tikai 5,5 miljonus dolāru, lai apmācītu DeepSeek V3 – skaitli, kas krasi kontrastē ar miljardiem, ko parasti ieguldījuši konkurenti.

Tikai mēnesi pēc DeepSeek V3 izlaišanas uzņēmums paaugstināja latiņu tālāk, atklājot DeepSeek-R1-argumentācijas modeli, kas izvietots kā uzticama alternatīva Openai O1 modelim. Licencēts MIT, DeepSeek-R1 ļauj izstrādātājiem brīvi destilēt un komercializēt tās iespējas. Šī pieejamība ir padarījusi to par pievilcīgu izvēli mazākām komandām un izstrādātājiem, kas strādā pie ierobežotiem budžetiem, kuriem joprojām ir nepieciešami AI risinājumi ar augstu sniegumu.

Cik liela tehnoloģija cenšas reaģēt uz DeepSeek traucējumiem

DeepSeek negaidītie panākumi ir sarunu pārveidošana ap AI inovācijām, dažiem plašsaziņas līdzekļu noieta tirgiem, kas liek domāt, ka DeepSeek rada “draudus amerikāņu AI dominance” un amerikāņu uzņēmumiem šajā jomā. Īpaši meta, šķiet, izjūt spiedienu.

Panika pie Meta AI

Anonīms meta darbinieks dalījās neapmierinātībā ar amatu profesionālajā forumā Aklsar nosaukumu, “Meta Genai org panikas režīmā.” Amats neatturēja:

“Tas sākās ar DeepSeek V3, kas lammu 4 padarīja jau aiz etaloniem. Ievainošanas pievienošana ievainojumiem bija “nezināma Ķīnas uzņēmums ar 5,5 miljonu dolāru apmācības budžetu”. Inženieri izmisīgi pārvietojas, lai sadalītu DeepSeek un kopētu visu un visu, ko mēs no tā varam. Es pat nepārspīlēju. ”

Darbinieks arī uzsvēra iekšējos jautājumus Meta AI nodaļā:

“Vadība ir noraizējusies par Genai Org masveida izmaksu attaisnošanu. Kā viņi saskaras ar vadību, kad katrs Genai Org “līderis” izdara vairāk nekā tas, ko maksāja, pilnībā apmācot DeepSeek V3, un mums ir desmitiem šādu “līderu”… DeepSeek R1 padarīja lietas vēl skarbāk. Es nevaru atklāt konfidenciālu informāciju, bet tā drīz būs publiska. ”

Šis amats aprakstīja uzpūstu organizāciju, kurā “trieciena satveršanas” mentalitāte un pārmērīga hercing ir aizstājusi koncentrētāku, uz inženierzinātnēm balstītu pieeju.

Ko DeepSeek pieaugums nozīmē AI attīstībai

DeepSeek ir modināšanas aicinājums AI nozarei. Atvērtā koda modeļa panākumi, kas balstīti uz kurpju auklas budžetu, rada jautājumus par to, vai tehnoloģiju giganti pārvar savas stratēģijas. Samazinot izmaksas un piedāvājot pieļaujamu licenci, DeepSeek ir atvēris durvis izstrādātājiem, kuri iepriekš nevarēja atļauties strādāt ar AI rīkiem ar augstu veiktspēju.

Meta, Openai un citiem galvenajiem dalībniekiem DeepSeek pieaugums ir vairāk nekā tikai konkurence – tas ir izaicinājums idejai, ka lielāki budžeti automātiski noved pie labākiem rezultātiem. Tas, vai šie uzņēmumi var pielāgoties, joprojām ir atklāts jautājums, taču viens ir skaidrs: DeepSeek ir pagriezis scenāriju, un nozare pievērš uzmanību.