Sarunas ar datoru var kļūt reālistiskākas

Satura rādītājs:

Sarunas ar datoru var kļūt reālistiskākas
Sarunas ar datoru var kļūt reālistiskākas
Anonim

Atslēgas līdzņemšanai

  • Meta izmanto AI, lai izveidotu programmas, kas var izteikt emocijas runā.
  • Uzņēmuma AI komanda teica, ka tā ir panākusi progresu izteiksmīgu vokalizāciju modelēšanā, piemēram, smieklu, žāvas, raudas un "spontānas pļāpas" reāllaikā.
  • AI tiek izmantots arī runas atpazīšanas uzlabošanai.
Image
Image

Pateicoties mākslīgā intelekta (AI) jaudai, iespējams, drīzumā varēsit tērzēt ar datoru dabiskāk.

Meta teica, ka ir panākusi ievērojamu progresu centienos izveidot reālistiskākas AI ģenerētas runas sistēmas. Uzņēmuma mākslīgā intelekta komanda teica, ka tā ir guvusi panākumus spējā modelēt izteiksmīgas vokalizācijas, piemēram, smieklus, žāvas un raudas, papildus "spontānai tērzēšanai" reāllaikā.

"Jebkurā sarunā cilvēki apmainās ar neverbāliem signāliem, piemēram, intonācijām, emocionālām izpausmēm, pauzēm, akcentiem, ritmiem, kas viss ir svarīgi cilvēku mijiedarbībai," komanda rakstīja nesenajā emuāra ierakstā.. "Taču mūsdienu mākslīgā intelekta sistēmām neizdodas uztvert šos bagātīgos, izteiksmīgos signālus, jo tās mācās tikai no rakstīta teksta, kas uztver to, ko mēs sakām, bet ne to, kā mēs sakām."

Gudrāka runa

Emuāra ierakstā Meta AI komanda paziņoja, ka strādā, lai pārvarētu tradicionālo AI sistēmu ierobežojumus, kas nespēj saprast neverbālos runas signālus, piemēram, intonācijas, emocionālas izteiksmes, pauzes, akcentus un ritmus.. Sistēmas tiek aizturētas, jo tās var mācīties tikai no rakstīta teksta.

Taču Meta darbs atšķiras no iepriekšējiem centieniem, jo tā AI modeļos var izmantot dabiskās valodas apstrādes modeļus, lai uztvertu visu runātās valodas būtību. Meta pētnieki apgalvo, ka jaunie modeļi var ļaut AI sistēmām nodot noskaņojumu, ko tās vēlas nodot, piemēram, garlaicību vai ironiju.

"Tuvākajā nākotnē mēs koncentrēsimies uz beztekstu paņēmienu izmantošanu, lai izveidotu noderīgas pakārtotas lietojumprogrammas, neprasot ne resursietilpīgas teksta etiķetes, ne automātiskās runas atpazīšanas sistēmas (ASR), piemēram, atbildes uz jautājumiem (piemēram, "Kā klājas" laikapstākļi?"), " emuāra ierakstā rakstīja komanda. "Mēs uzskatām, ka prozodija runā var palīdzēt labāk analizēt teikumu, kas savukārt atvieglo nolūka izpratni un uzlabo atbildes uz jautājumu veiktspēju."

AI nodrošina izpratni

Datori ne tikai uzlabo nozīmes paziņošanu, bet arī mākslīgais intelekts tiek izmantots, lai uzlabotu runas atpazīšanu.

Datorzinātnieki ir strādājuši pie datora runas atpazīšanas vismaz kopš 1952. gada, kad trīs Bell Labs pētnieki izveidoja sistēmu, kas varētu atpazīt atsevišķus ciparu ciparus, AI Dynamics galvenais tehnoloģiju speciālists Raiens Monsurāts sacīja e-pastā. Lifewire. Līdz 90. gadiem runas atpazīšanas sistēmas bija komerciāli pieejamas, taču tām joprojām bija pietiekami augsts kļūdu līmenis, lai atturētu no lietošanas ārpus ļoti specifiskām lietojumu jomām, piemēram, veselības aprūpei.

"Tagad, kad dziļās mācīšanās modeļi ir ļāvuši ansambļa modeļiem (piemēram, Microsoft) sasniegt pārcilvēcisku veiktspēju runas atpazīšanā, mums ir tehnoloģija, kas nodrošina skaļruņu neatkarīgu verbālo saziņu ar datoriem plašā mērogā," sacīja Monsurate. "Nākamajā posmā tiks samazinātas izmaksas, lai ikvienam, kas izmanto Siri vai Google AI palīgus, būtu piekļuve šāda līmeņa runas atpazīšanai."

Image
Image

AI ir noderīga runas atpazīšanai, jo tā laika gaitā var uzlaboties, mācoties, AI balss uzņēmuma Verbit.ai galvenais ieņēmumu dienesta vadītājs un ģenerāldirektors Ariels Utniks pastāstīja Lifewire e-pasta intervijā. Piemēram, Verbit apgalvo, ka tā iekšējā mākslīgā intelekta tehnoloģija nosaka un filtrē fona trokšņus un atbalsis un pārraksta skaļruņus neatkarīgi no akcenta, lai ģenerētu detalizētus, profesionālus transkriptus un parakstus no tiešraides un ierakstīta video un audio.

Bet Utnik teica, ka lielākā daļa pašreizējo runas atpazīšanas platformu ir tikai 75–80% precīzas.

"AI nekad pilnībā neaizstās cilvēkus, jo transkribētāju, korektoru un redaktoru personīgais pārskats ir nepieciešams, lai nodrošinātu augstas kvalitātes un visaugstākās precizitātes galīgo atšifrējumu," viņš piebilda.

Lai novērstu hakerus, varētu izmantot arī labāku balss atpazīšanu, e-pastā sacīja Sandžajs Gupta, balss atpazīšanas uzņēmuma Mitek Systems globālais produktu un korporatīvās attīstības vadītājs. Pētījumi liecina, ka divu gadu laikā 20 procentos no visiem veiksmīgajiem kontu pārņemšanas uzbrukumiem tiks izmantota sintētiska balss palielināšana, viņš piebilda.

"Tas nozīmē, ka dziļo viltojumu tehnoloģija kļūst arvien sarežģītāka, mums vienlaikus ir jāizveido uzlabota drošība, kas var cīnīties ar šo taktiku kopā ar attēlu un video dziļiem viltojumiem," sacīja Gupta. "Lai cīnītos pret balss viltošanu, nepieciešama dzīvīguma noteikšanas tehnoloģija, kas spēj atšķirt dzīvu balsi no ierakstītas, sintētiskas vai datorizētas balss versijas."

Labojums 2022-05-04: Izlabota Raiena Monsurāta vārda pareizrakstība 9. punktā.

Ieteicams: