Vai Openai nozaga DeepSeek kodu? O3-mini argumentācija ķīniešu dzirksteles ai zādzību pretrunās

Openai jaunākais modelis O3-Mini ir pacēlis uzacis pēc tam, kad lietotāji, kā ziņots, atklāja, ka tas rada atbildes ķīniešu valodā, pat ja tas tiek prasīts angļu valodā. Šī negaidītā izturēšanās, ko uzsvēra X (iepriekš Twitter) lietotājs Vikhyat Rana, ir veicinājis spekulācijas, ka Openai, iespējams, ir aizņēmies no DeepSeek, atvērtā koda AI projekta, kas specializējas ķīniešu valodas apstrādē.

Apsūdzība parādījās mazāk nekā nedēļu pēc tam, kad Openai apgalvoja, ka DeepSeek ir nokopējis savus patentētos AI modeļus, lai apmācītu atvērtā koda sistēmu, izmantojot paņēmienu, kas pazīstams kā “destilācija”, kas ļauj mazam modelim atdarināt lielāka veiktspēju, vienlaikus izmantojot mazāk Resursu skaitļošana.

Openai apsūdzēts par DeepSeek koda kopēšanu

Atbildot uz Rana ziņu, X lietotājs, vārdā Daiww, apgalvoja, ka Openai jaunākais O3-Mini modelis ir argumentēts ķīniešu valodā, kas liek domāt, ka Openai, iespējams, ir izmantojis Deepseek atvērtā koda kodu vai datus, pirms izlaišanas to pareizi pilnveidojot.

O3-Mini atbildēja uz angļu valodu ķīniešu valodā

Izdevums parādījās, kad Rana dalījās ar ekrānuzņēmumu ar vaicājumu angļu valodā, kā rezultātā ķīniešu valodā tika sniegta atbilde. Atbilde ietvēra detalizētus tehniskus skaidrojumus par Pyscript un JavaScript apstrādi ar audio API, liekot dažiem apšaubīt, vai Openai integrēti vai izmantoti dati no esošajām ķīniešu valodas datu kopām, tos pilnībā nepārskatot.

Rana ziņojumā Rana jautāja: “Kāpēc O3-Mini ir argumentācija ķīniešu valodā”, uz kuru Openai O3-Mini atbildēja ķīniešu valodā.

“Domāja par Python koda konvertēšanu 9 sekundes

启动 Pyscript 探索
使用 Pyscript 创建画布类的边框
过滤评估中

在考虑使用 JavaScript 处理音频输入后，我决定写一个 Pyscript 假子，借助 HTML Canas 和 Web Audio API ，通过 Python 控制声音，然后这可能比较复杂。

融合音频输入和 Python 感觉不难。放大了。通过 Pyodide 的 JS 模块，我可以接入 Web 音频 API ，定期计算音量并更新播放。

更新播放和处理音频输入是不相干的，可以利用 Pyscript 的 JS 模块和滚动动画来计算音频偏移并动

Kāpēc O3-Mini ir argumentācija ķīniešu valodā 🥹 pic.twitter.com/2z8mncprby

– Vikhyat Rana (@the_vikhyat) 2025. gada 1. februāris

Zemāk ir Daiww atbilde uz Rana ziņu:

“Jaunākais Openai O3-Mini ir argumentācija ķīniešu valodā. Šķiet, ka Openai nokopēja DeepSeek atvērtā koda kodu un datus, atbrīvojot O3-Mini bez pienācīgas rediģēšanas. ”

Jaunākais Openai O3-Mini ir argumentācija ķīniešu valodā, šķiet, ka Openai kopēja Deepseek atvērtā koda kodu/datus un izlaida O3-Mini bez rūpīgi rediģēšanas. pic.twitter.com/tkootanhoq

– daiww (@beijingdai) 2025. gada 3. februāris

Openai klusums un sekas

Tikmēr Openai vēl nav jārisina apgalvojumi. Situācija izceļ plašākas bažas par pārredzamību AI modeļa apmācībā, atvērtā avota datu ētiskai izmantošanai un negaidītas uzvedības risku AI iznākumos. Ja Openai savus datus ieguva no DeepSeek, tas varētu mainīt to, kā patentētie AI uzņēmumi mijiedarbojas ar atvērtā koda kopienām un izvirzīt jautājumus par datu kopas auditu.

Apsūdzības par atvērtā koda koda nepareizu izmantošanu

Daži kritiķi uzskata, ka Openai, iespējams, ir iestrādājuši DeepSeek publiski pieejamās datu kopas, neapspriežot avotu. DeepSeek ir atvērtā koda AI iniciatīva, kas specializējas ķīniešu valodas modeļos, un pēkšņa O3-Mini prasme šajā apgabalā ir veicinājusi spekulācijas par tā izcelsmi. Ja Openai izmantotu DeepSeek darbu, tas varētu izraisīt ētikas un intelektuālā īpašuma problēmas AI pētniecības kopienā.

Lielāki jautājumi spēlē

Šīs pretrunas papildina notiekošās debates par AI ētiku, datu iegūšanu un korporatīvo atbildību AI attīstībā. Uzņēmumi, piemēram, Openai, turpina virzīt robežas ģeneratīvā AI, taču joprojām ir jautājumi par atbildību un caurspīdīgumu.

Tā kā AI kopiena vēro Openai atbildi, galvenais jautājums ir par to, vai O3-Mini ķīniešu argumentācija bija neparedzēts tās apmācības rezultāts vai dziļāka problēma ar AI datu ētiku un intelektuālo īpašumu. Nākamajās dienās var veikt vairāk rūpīgas pārbaudes, un Openai, iespējams, būs jānoskaidro savus datu avotus, lai saglabātu uzticību. Pagaidām situācija joprojām nav atrisināta.

Neskatoties uz notiekošajiem apgalvojumiem, Altmans atzina Deepseek modeli par spēcīgu konkurentu un norādīja uz nepieciešamību pēc lielākas skaitļošanas jaudas, lai saglabātu malu. Post X X viņš aprakstīja DeepSeek R1 modeli kā “iespaidīgu, it īpaši ap to, ko viņi spēj piegādāt par cenu”.

DeepSeek rentabla V3 modeļa atklāšana ir mazinājis nozares spēlētājus visā pasaulē tajā, ko daži ir nodēvējuši par “AI Sputnik” mirkli. Ziņojumi liecina, ka DeepSeek AI izrāvienu modelis tika izstrādāts, kura izmaksas bija zem 6 miljoniem USD – satraucošs skaitlis ASV tehnoloģiju firmām, kuras ir ieguldījušas miljardus līdzīgās tehnoloģijās.

Saskaņā ar vairākiem ziņojumiem DeepSeek V3 pārspēja vadošos modeļus, piemēram, LLAMA 3.1 un GPT-4O, galvenajos etalonos, ieskaitot konkurences kodēšanas problēmas CodeForces. Projekts tika pabeigts ar budžetu tikai 5,5 miljonu ASV dolāru apmērā – izteikts pretstats simtiem miljonu, ko iztērēja konkurenti. Šis izrāviens izaicina priekšstatu, ka progresīvai AI attīstībai ir nepieciešams milzīgs finanšu ieguldījums.