OpenAI tagad var atjaunot cilvēku balsis, izmantojot platformu “Voice Engine”. Microsoft finansētais uzņēmums jauno AI dzinēju tur pie krūtīm acīmredzamu ētisku un juridisku seku dēļ.
Pēc ChatGPT, DALL-E un Sora milzīgajiem panākumiem OpenAI tagad ir iesaistījies skaņas jomā, jo īpaši cilvēka runas un balss jomā. Voice Engine AI pašlaik ir beta testēšanas fāzē, taču interneta lietotāji, iespējams, nevarēs reģistrēties abonementam.
Voice Engine var atjaunot daudzvalodu cilvēku balsis tikai ar 15 sekunžu ierakstiem
ChatGPT pārņēma pasauli ar vētru, DALL-E atklāja radošumu miljonos, un Sora drīzumā ļaus vienkāršiem interneta lietotājiem kļūt par filmu veidotājiem. Pēc teksta, attēliem un videoklipiem OpenAI tagad ir paziņojis par Voice Engine — AI platformu, kas var atjaunot cilvēku balsis.
The New York Times saņēma Voice Engine platformas demonstrāciju. Tiek ziņots, ka mākslīgā intelekta dzinējs var atjaunot cilvēka balsi no 15 sekunžu ieraksta. Ja tas nav pietiekami biedējoši, pēc vajadzīgās informācijas absorbcijas Voice Engine var ierunāt jebkuru teksta uzvedni atjaunotā cilvēka balsī.
Mēs dalāmies ar mūsu atziņām, kas gūtas no neliela apjoma Voice Engine priekšskatījuma — modeļa, kas izmanto teksta ievadi un vienu 15 sekunžu audio paraugu, lai radītu dabiski skanošu runu, kas ļoti atgādina oriģinālo skaļruni. https://t.co/yLsfGaVtrZ
— OpenAI (@OpenAI) 2024. gada 29. marts
Pārsteidzoši, ka teksta uzvednei pat nav jābūt tā runātāja dzimtajā valodā, kura balss tika izmantota AI dzinēja apmācībai. Citiem vārdiem sakot, angļu valodā runājošais var runāt spāņu, franču, ķīniešu vai daudzās citās valodās, izmantojot Voice Engine.
Ņemot vērā šādas tehnoloģijas acīmredzamās nepilnības, OpenAI ir apliecinājis, ka pēta vairākas drošības pārbaudes, piemēram, ūdenszīmes. Būs vadības ierīces, kas ierobežo Voice Engine radīt noteiktu personu cilvēku balsis.
#OpenAI jaunais balss dzinējs palīdz pacientam, kurš zaudējis runu smadzeņu audzēja dēļ, atkal runāt tekoši. @OpenskiesX pic.twitter.com/YB0mjKJYew
— RameshR (@rezmeram) 2024. gada 29. marts
Interesanti, ka OpenAI produktu vadītājs Džefs Heriss ir apgalvojis, ka uzņēmumam nav tūlītēju plānu pelnīt naudu no šīs tehnoloģijas. Viņš piebilda, ka tās galvenais mērķis ir būt noderīgam cilvēkiem, kuri zaudējuši balsi slimības vai nelaimes gadījumā.
Vai OpenAI piedāvās savu jaunāko darbu interneta lietotājiem kā abonementu?
OpenAI Sora, kas ļauj lietotājiem izveidot 60 sekunžu filmu, izmantojot tikai teksta uzvednes, nav pieejama plašai sabiedrībai. Tāpat uzņēmums nav izlaidis nevienu Voice Engine versiju.
Voice Engine pašlaik ir pieejams “nelielai uzņēmumu grupai”. Vienkārši sakot, dažiem uzņēmumiem, iespējams, pēc ielūguma, ir ierobežota piekļuve platformai.
Lieki piebilst, ka mākslīgā intelekta platformai, kas var atjaunot cilvēku balsis vairākās valodās, pamatojoties uz 15 ierakstiem, ir milzīgas ētiskas un juridiskas sekas.
OpenAI publiski paziņo par savu Voice Engine, kas ļauj klonēt balsi no 15 sekunžu audio.https://t.co/zMRViqN5f5
Sākotnēji tas tika izstrādāts 2022. gada beigās, taču viņi to ir pārbaudījuši ar dažādiem uzticamiem partneriem. Daži demonstrācijas paraugi ir kopīgoti emuāra ziņā. Viņiem nav… pic.twitter.com/aGK0ghwlsv
— Tanishq Mathew Abraham, Ph.D. (@iScienceLuvr) 2024. gada 29. marts
OpenAI var būt ierobežota piekļuve Voice Engine. Tomēr ir satraucoši atzīmēt, ka mākslīgais intelekts ir pārvērties par behemotu.
Papildus pārliecinošiem viltotiem attēliem un videoklipiem krāpnieki un krāpnieki jau ilgu laiku ir izmantojuši mākslīgo intelektu, lai atdarinātu cilvēku balsis. Vairāki upuri ir kļuvuši par upuriem dziļām viltotām balss ziņām, kas izklausījās tā, it kā viņu radinieki būtu nonākuši nepatikšanās un prasījuši naudu.
OpenAI tikko uzsāka Voice Engine,
Tas izmanto teksta ievadi un vienu 15 sekunžu audio paraugu, lai radītu dabiski skanošu runu, kas ļoti atgādina oriģinālo skaļruni.
Atsauces un ģenerētais audio ir ļoti tuvs un grūti atšķirams.
Sīkāka informācija 🧵 pic.twitter.com/tJRrCO2WZP— AshutoshShrivastava (@ai_for_success) 2024. gada 29. marts
Nepareizajās rokās Voice Engine varētu pieņemt un atjaunot politiķu, slavenību, žurnālistu un citu ievērojamu personību balsis. Platformu varētu izmantot, lai izveidotu pārliecinošus audio klipus, kas izplata dezinformāciju vai propagandu. Tikpat biedējošā scenārijā hakeri un noziedznieki varētu apdraudēt drošības sistēmas, kas balstās uz balss autentifikāciju.
Tādējādi OpenAI, visticamāk, ļoti cenzētu un regulētu Voice Engine platformu. Tam būtu jāformulē dažas izturīgas un gudras digitālās slēdzenes, kā arī stingras drošības pārbaudes, lai novērstu to ļaunprātīgu izmantošanu.
Neņemot vērā drošības un ētikas apsvērumus, OpenAI Voice Engine varētu būt ārkārtīgi noderīgs filmu un tīmekļa seriālu producentiem, kuriem ir jādublē savi darbi citās valodās. Tāpat arī izglītības un izklaides jomas varētu gūt milzīgu labumu.