Vestlused arvutiga võivad muutuda realistlikumaks

Sisukord:

Vestlused arvutiga võivad muutuda realistlikumaks
Vestlused arvutiga võivad muutuda realistlikumaks
Anonim

Võtmed kaasavõtmiseks

  • Meta kasutab tehisintellekti, et luua programme, mis suudavad kõnes emotsioone väljendada.
  • Ettevõtte tehisintellekti meeskond ütles, et on teinud edusamme ekspressiivsete häälitsuste, nagu naer, haigutamine, nutt ja spontaansed vestlused reaalajas modelleerimisel.
  • AI-t kasutatakse ka kõnetuvastuse täiustamiseks.
Image
Image

Võib-olla saate tänu tehisintellekti (AI) võimsusele oma arvutiga peagi loomulikum alt vestelda.

Meta ütles, et on saavutanud märkimisväärseid edusamme oma jõupingutustes realistlikumate AI-ga loodud kõnesüsteemide loomisel. Ettevõtte tehisintellekti meeskond ütles, et lisaks spontaansele reaalajas vestlusele on ta teinud edusamme ka ekspressiivsete häälitsuste, nagu naer, haigutamine ja nuttu modelleerimine.

"Iga vestluse käigus vahetavad inimesed täis mitteverbaalseid signaale, nagu intonatsioonid, emotsionaalne väljendus, pausid, aktsendid, rütmid – kõik need on inimestevahelise suhtluse jaoks olulised," kirjutas meeskond hiljutises ajaveebi postituses.. "Kuid tänapäeva tehisintellekti süsteemid ei suuda neid rikkalikke ja väljendusrikkaid signaale püüda, sest nad õpivad ainult kirjutatud tekstist, mis tabab seda, mida me ütleme, kuid mitte seda, kuidas me seda ütleme."

Targem kõne

Ajaveebipostituses ütles Meta AI meeskond, et nad töötavad selle nimel, et ületada traditsiooniliste tehisintellektisüsteemide piirangud, mis ei saa aru mitteverbaalsetest kõnesignaalidest, nagu intonatsioonid, emotsionaalsed väljendid, pausid, aktsendid ja rütmid.. Süsteeme hoitakse tagasi, sest nad saavad õppida ainult kirjutatud tekstist.

Kuid Meta töö erineb varasematest jõupingutustest, kuna selle AI-mudelid saavad kõnekeele täieliku olemuse tabamiseks kasutada loomuliku keele töötlemise mudeleid. Meta teadlased ütlevad, et uued mudelid võimaldavad AI-süsteemidel edastada emotsioone, mida nad soovivad edasi anda, nagu igavus või iroonia.

"Lähitulevikus keskendume tekstivabade tehnikate rakendamisele kasulike allavoolu rakenduste loomiseks, ilma et oleks vaja ressursimahukat tekstisilte või automaatseid kõnetuvastussüsteeme (ASR), nt küsimustele vastamist (nt "Kuidas läheb ilm?"), "kirjutas meeskond blogipostituses. "Usume, et kõne prosoodia võib aidata lauset paremini sõeluda, mis omakorda hõlbustab kavatsuse mõistmist ja parandab küsimusele vastamise toimivust."

AI võimendab mõistmist

Arvutid ei muutu mitte ainult paremaks tähenduste edastamisel, vaid tehisintellekti kasutatakse ka kõnetuvastuse täiustamiseks.

Arvutiteadlased on arvutikõnetuvastuse kallal töötanud vähem alt aastast 1952, mil kolm Bell Labsi teadlast lõid süsteemi, mis suudab ära tunda üksikuid numbrilisi numbreid, ütles AI Dynamicsi tehnoloogiajuht Ryan Monsurate e-kirjas. Lifewire. 1990. aastateks olid kõnetuvastussüsteemid kaubanduslikult saadaval, kuid nende veamäär oli siiski piisav alt kõrge, et takistada kasutamist väljaspool väga spetsiifilisi rakendusvaldkondi, nagu tervishoid.

"Nüüd, kui süvaõppemudelid on võimaldanud ansamblimudelitel (nagu Microsofti mudelid) saavutada kõnetuvastuses üliinimlikku jõudlust, on meil tehnoloogia, mis võimaldab kõnelejast sõltumatut verbaalset suhtlust arvutitega ulatuslikult, " ütles Monsurate. "Järgmine etapp hõlmab kulude alandamist, nii et kõigil, kes kasutavad Siri või Google'i AI abilisi, oleks juurdepääs sellele kõnetuvastuse tasemele."

Image
Image

AI on kõnetuvastuse jaoks kasulik, kuna see võib õppimise kaudu aja jooksul paraneda, ütles tehisintellekti kõneettevõtte Verbit.ai tuluhaldur ja peadirektor Ariel Utnik Lifewire'ile meiliintervjuus. Näiteks väidab Verbit, et tema ettevõttesisene tehisintellekti tehnoloogia tuvastab ja filtreerib välja taustmüra ja kaja ning transkribeerib kõlarid olenemata aktsendist, et luua reaalajas ja salvestatud videost ja helist üksikasjalikud professionaalsed transkriptsioonid ja subtiitrid.

Kuid Utnik ütles, et enamik praeguseid kõnetuvastusplatvorme on ainult 75–80% täpsed.

"AI ei asenda kunagi täielikult inimesi, kuna transkribeerijate, korrektorite ja toimetajate isiklik ülevaade on vajalik kvaliteetse ja ülima täpsusega lõpliku ärakirja tagamiseks," lisas ta.

Paremat hääletuvastust saab kasutada ka häkkerite tõkestamiseks, ütles Sanjay Gupta, hääletuvastusettevõtte Mitek Systems ülemaailmne toote- ja ettevõttearenduse asepresident. Uuringud näitavad, et kahe aasta jooksul kasutavad 20 protsenti kõigist edukatest konto ülevõtmise rünnakutest sünteetilist häälevõimendust, lisas ta.

"See tähendab, et kui sügav võltstehnoloogia muutub keerukamaks, peame samaaegselt looma täiustatud turvalisuse, mis suudaks nende taktikate vastu võidelda koos piltide ja video sügavate võltsingutega," ütles Gupta. "Häälepettuste vastu võitlemiseks on vaja elavuse tuvastamise tehnoloogiat, mis suudab eristada elavat häält salvestatud, sünteetilisest või arvutiga loodud versioonist."

Parandus 2022-05-04: parandatud Ryan Monsurate'i nime kirjapilt lõikes 9.

Soovitan: