AI balsis oficiāli ir pārāk reālistiskas!

AI radītās balsis nav nekas jauns, jo tās pastāv jau gadu desmitiem. Lai kā arī būtu, digitālās balsis, ko esam piedzīvojuši gadu gaitā, nevienu nemaldinās. Tomēr mūsdienās es domāju, ka digitālās balsis ir sasniegušas punktu, kurā tās var būt biedējošas. Tas ir vairāku iemeslu dēļ. Vai AI radītās balsis mūsdienās ir pārāk reālistiskas?

Mēs esam nonākuši tālu no tām klīniskajām un nesadalītajām balsīm, ko esam dzirdējuši gadu gaitā. Padomājiet par vecām digitālajām balsīm no 2000. un 2010. gadiem. Google palīgs un Alexa bija tikpat labi, cik tas bija paredzēts. Tomēr ar ģeneratīvo AI uzplaukumu radās milzīgs impulss, lai AI padarītu reālistiskāku, un jūs varat derēt, ka tas būtiski ietekmēja to, cik daudz darba cilvēki iegulda savās digitālajās balsīs.

Tagad padomājiet par balsīm, ko OpenAI atklāja, palaižot GPT-4o. Šobrīd platformā ir četras balsis. Mēs arī nevaram aizmirst par Google Gemini balsi. Lai gan tie visi izklausās reālistiski, es nedomāju, ka mēs redzējām, cik neprātīgas šīs balsis var kļūt. Tikai tad, kad es izmēģināju Google jauno rīku, es sapratu, ka digitālās balsis, iespējams, ir pārkāpušas reālisma slieksni.

NotebookLM man parādīja, ka digitālās balsis ir pārāk reālistiskas

Ja neesat par to dzirdējis, Google pagājušajā gadā izlaida produktu ar nosaukumu NotebookLM. Uztveriet to kā piezīmjdatoru ar mākslīgā intelekta palīdzību. Varat augšupielādēt informāciju, piemēram, avotus un dokumentus par noteiktu tēmu, un sekot līdzi materiālam. Google izmantos savu mākslīgo intelektu, lai lasītu un izgūtu informāciju no jūsu augšupielādētā materiāla.

Izmantojot šo rīku, varat uzdot jautājumus par augšupielādēto materiālu. Padomājiet par to, piemēram, izmantojot tērzēšanas robotu, kas apmācīts tikai par jūsu augšupielādēto materiālu. Iedomājieties, ka augšupielādējat visu mācību grāmatu par fiziku un varat uzdot jautājumus par tajā ietverto materiālu.

Lai gan šī platforma nav nekas jauns, tajā ir jauna funkcionalitāte, ko Google ir izdomājis un tagad testē. Varat likt Google ģenerēt aplādes stila diskusiju, pamatojoties uz jūsu augšupielādēto informāciju. Kad es saku aplādes stils, es domāju, ka tas ir domāts, lai radītu iespaidu, ka divi cilvēki patiešām ir uzstādījuši mikrofonu un ierakstījuši īstu aplādi.

Balsis izklausās satraucoši reālistiskas vairāku iemeslu dēļ. Teikumi plūst dabiski, un runātāju ritms un locīšana ir ārkārtīgi dabiska. Ne tikai tas, bet arī Google pat iemūžināja dažas mazās lietas, kas atšķir cilvēku no mašīnas. Es dzirdu elpas trokšņus, tas pievieno “ums” un “patīk”, ko dzirdat, kad cilvēki runā reālajā dzīvē, un bija pat gadījums, kad viens no runātājiem nepareizi iesāka vārdu un izlaboja sevi. Google pat gāja tik tālu, ka viens no runātājiem smējās.

Viena lieta ir radīt balsi, kas skan labi, sniedzot tiešu atbildi vai lasot no scenārija. Tomēr tas ir pavisam cits zvērs, kas izstrādā balsi, kas izklausās tā, it kā tajā notiek cilvēku diskusija. Un Google to paveica.

Podcast epizodes laikā viena lieta, kas man iekrita, bija šī:

1. runātājs: “Tātad, rakstā ir īpaši izsauktas divas lietotnes. USB Audio Pro un Musicalot. Vai esat dzirdējuši par kādu no tiem?”

2. skaļrunis: “USB Audio Pro. Tas zvana. Es domāju, ka mans draugs to izmanto.

Tas burtiski norādīja uz draudzīgām attiecībām starp vienu no runātājiem un cilvēku. Šie piemēri ir starp daudziem citiem piemēriem.

Google balss paveica visbriesmīgāko…

Labi, tas ir labi, taču ir arī citas labas digitālās balsis. Ar ko tas atšķiras? Lieta ir tāda, ka tas, iespējams, izdarīja visbriesmīgāko, ko AI balss varēja darīt… tas lika man aizmirst.

Es augšupielādēju vienu no saviem rakstiem un liku tam izveidot diskusiju. NotebookLM izspļāva 12 1/2 minūšu garu mini aplādes epizodi. Es sāku to klausīties, un šoks par to, ka tā ir AI radīta diskusija, pazuda. Pēc dažām minūtēm es patiesībā aizmirsu, ka īsi klausos AI radītās balsis. Varbūt tas bija uz minūti, varbūt tas bija 15 sekundes. Taču Google ir apguvis mākslu, kā likt balsīm skanēt tik pamatoti un reālistiski.

Kā jau varēja nojaust, tas mani nobiedēja. Es zināju, ka tas ir AI ģenerēts, taču tas bija tik reālistisks, ka aizmirsu.

Pēdējais puzles gabals

Uzņēmumi dara visu iespējamo, lai iegrūstu mūsu rīklē savus AI produktus, un tam ir vairāki iemesli. Protams, ir uzņēmumi, kas tikai cenšas iepriecināt investorus, taču ir maldīgi uzņēmumi, kuri vēlētos, lai jūs aizmirstu par cilvēku radīta satura lietderību. Mēs redzam platformas, kas burtiski ģenerē veselus videoklipus jūsu vietā ar AI ģenerētu iemiesojumu, AI ģenerētu skriptu un AI ģenerētu balsi.

Ne tikai tas, bet arī tādi uzņēmumi kā Wix reklamē, ka lietotāji var izveidot veselas vietnes dažu minūšu laikā, izmantojot AI. Tāpat mēs nevaram aizmirst par AI iepazīšanās lietotnēm. Pie velna, ir pat sociālo mediju lietotne, kurā AI pats ģenerē savu saturu un ziņas. Mēs dzīvojam pasaulē, kurā sākam aizmirst cilvēku radīto skaistumu, un to vēl vairāk pasliktina tas, ka ir cilvēki, kas atbalsta šo uzvedību.

Tagad, kad AI balsis kļūst tik labas, šī tendence pasliktināsies. Lieta tāda, ka cilvēki asociējas ar runu; silta un cilvēciski skanoša balss var likt cilvēkam ar kaut ko sazināties. To tikai saasina uzņēmumi, kas padara balsis personiskākas un pielāgotas konkrētai personai.

Reālistiskas balsis ir viena no pēdējām mīklas daļām, kas liek cilvēkam pilnībā asociēties ar AI. Ja klausāties mākslīgo intelektu ar aukstu un dusmīgu balsi, tas pastāvīgi atgādina, ka tas ir robots. Kad balss kļūst reālistiska, pastāv lielāka iespēja, ka jūs to uzskatīsit par cilvēku.

Tātad, kas varētu notikt pa ceļu?

Mēs esam nonākuši pie lūzuma punkta, kad runa ir par cilvēka un AI attiecībām. Ir cilvēki, kuri jau asociējas ar AI. OpenAI pat izteica paziņojumu, aicinot cilvēkus nemīlēties ChatGPT. Vai jūs zināt, kas tajā ir sajaukts? Ikviens, kas ir pietiekami vecs, lai sazinātos ar AI, ir uzaudzis tradicionālākā pasaulē, kurā vienīgā mijiedarbība bija cilvēku.

Taču, ja uzņēmumi nospiež cilvēku AI robežas un nospiež savu AI mūsu rīklē, kā būs ar nākamo paaudzi vai nākamo paaudzi? Iedomājieties, ka rīt piedzims bērns, kurš aug arvien vairāk uz AI virzītā pasaulē. Kā tas bērns būtu 2040. gadā, kad viņš būs pusaudzis? Cik daudz LLM būtu ietekmējuši šī bērna dzīvi? Vai šis bērns zinās, cik nepareizas ir mākslīgā intelekta radītās attiecības, ja viņu ir mācījis tērzēšanas robots, nevis skolotājs?

Tagad, kad balsis ir tik īstas, kāda nozīme ir aplādes ierakstīšanai, ja to var vienkārši ģenerēt? Protams, cilvēki mūsdienās ķersies pie AI ģenerētas aplādes, taču padomājiet par to, kā būs pēc dažiem gadiem, kad AI būs vairāk normalizēts. Jaunākiem klausītājiem, kuri uzauguši ap AI, visticamāk, būs vienalga. Tā vietā, lai slavētu podkāstu grupu, klausītāji slavēs modeli, kuram tiek ievadīti dati.

Tā kā AI balsis izklausās tik reālistiski, cilvēce ir soli tuvāk tam, lai aizmirstu par pašu cilvēci. Google ir apguvis balss mākslu, un mums nav ne jausmas, kādas sekas tam sekos.