OpenAI paziņo par balss dzinēju, lai radītu cilvēku balsis

OpenAI tagad var atjaunot cilvēku balsis, izmantojot platformu “Voice Engine”. Microsoft finansētais uzņēmums jauno AI dzinēju tur pie krūtīm acīmredzamu ētisku un juridisku seku dēļ.

Pēc ChatGPT, DALL-E un Sora milzīgajiem panākumiem OpenAI tagad ir iesaistījies skaņas jomā, jo īpaši cilvēka runas un balss jomā. Voice Engine AI pašlaik ir beta testēšanas fāzē, taču interneta lietotāji, iespējams, nevarēs reģistrēties abonementam.

Voice Engine var atjaunot daudzvalodu cilvēku balsis tikai ar 15 sekunžu ierakstiem

ChatGPT pārņēma pasauli ar vētru, DALL-E atklāja radošumu miljonos, un Sora drīzumā ļaus vienkāršiem interneta lietotājiem kļūt par filmu veidotājiem. Pēc teksta, attēliem un videoklipiem OpenAI tagad ir paziņojis par Voice Engine — AI platformu, kas var atjaunot cilvēku balsis.

The New York Times saņēma Voice Engine platformas demonstrāciju. Tiek ziņots, ka mākslīgā intelekta dzinējs var atjaunot cilvēka balsi no 15 sekunžu ieraksta. Ja tas nav pietiekami biedējoši, pēc vajadzīgās informācijas absorbcijas Voice Engine var ierunāt jebkuru teksta uzvedni atjaunotā cilvēka balsī.

Pārsteidzoši, ka teksta uzvednei pat nav jābūt tā runātāja dzimtajā valodā, kura balss tika izmantota AI dzinēja apmācībai. Citiem vārdiem sakot, angļu valodā runājošais var runāt spāņu, franču, ķīniešu vai daudzās citās valodās, izmantojot Voice Engine.

Ņemot vērā šādas tehnoloģijas acīmredzamās nepilnības, OpenAI ir apliecinājis, ka pēta vairākas drošības pārbaudes, piemēram, ūdenszīmes. Būs vadības ierīces, kas ierobežo Voice Engine radīt noteiktu personu cilvēku balsis.

Interesanti, ka OpenAI produktu vadītājs Džefs Heriss ir apgalvojis, ka uzņēmumam nav tūlītēju plānu pelnīt naudu no šīs tehnoloģijas. Viņš piebilda, ka tās galvenais mērķis ir būt noderīgam cilvēkiem, kuri zaudējuši balsi slimības vai nelaimes gadījumā.

Vai OpenAI piedāvās savu jaunāko darbu interneta lietotājiem kā abonementu?

OpenAI Sora, kas ļauj lietotājiem izveidot 60 sekunžu filmu, izmantojot tikai teksta uzvednes, nav pieejama plašai sabiedrībai. Tāpat uzņēmums nav izlaidis nevienu Voice Engine versiju.

Voice Engine pašlaik ir pieejams “nelielai uzņēmumu grupai”. Vienkārši sakot, dažiem uzņēmumiem, iespējams, pēc ielūguma, ir ierobežota piekļuve platformai.

Lieki piebilst, ka mākslīgā intelekta platformai, kas var atjaunot cilvēku balsis vairākās valodās, pamatojoties uz 15 ierakstiem, ir milzīgas ētiskas un juridiskas sekas.

OpenAI var būt ierobežota piekļuve Voice Engine. Tomēr ir satraucoši atzīmēt, ka mākslīgais intelekts ir pārvērties par behemotu.

Papildus pārliecinošiem viltotiem attēliem un videoklipiem krāpnieki un krāpnieki jau ilgu laiku ir izmantojuši mākslīgo intelektu, lai atdarinātu cilvēku balsis. Vairāki upuri ir kļuvuši par upuriem dziļām viltotām balss ziņām, kas izklausījās tā, it kā viņu radinieki būtu nonākuši nepatikšanās un prasījuši naudu.

Nepareizajās rokās Voice Engine varētu pieņemt un atjaunot politiķu, slavenību, žurnālistu un citu ievērojamu personību balsis. Platformu varētu izmantot, lai izveidotu pārliecinošus audio klipus, kas izplata dezinformāciju vai propagandu. Tikpat biedējošā scenārijā hakeri un noziedznieki varētu apdraudēt drošības sistēmas, kas balstās uz balss autentifikāciju.

Tādējādi OpenAI, visticamāk, ļoti cenzētu un regulētu Voice Engine platformu. Tam būtu jāformulē dažas izturīgas un gudras digitālās slēdzenes, kā arī stingras drošības pārbaudes, lai novērstu to ļaunprātīgu izmantošanu.

Neņemot vērā drošības un ētikas apsvērumus, OpenAI Voice Engine varētu būt ārkārtīgi noderīgs filmu un tīmekļa seriālu producentiem, kuriem ir jādublē savi darbi citās valodās. Tāpat arī izglītības un izklaides jomas varētu gūt milzīgu labumu.