Kas need ülimuljet avaldavad AI-heliraamatute hääled on head või halvad?

Sisukord:

Kas need ülimuljet avaldavad AI-heliraamatute hääled on head või halvad?
Kas need ülimuljet avaldavad AI-heliraamatute hääled on head või halvad?
Anonim

Võtmed kaasavõtmiseks

  • DeepZen kasutab AI-t (tehisintellekti), et luua tekstist ehmatav alt realistlikke audioraamatuid.
  • Tehnika kasutab ehitusplokkide loomiseks tõelisi inimhäälnäitlejaid.
  • Amazon ja Audible ei aktsepteeri praegu arvutiga loodud audioraamatuid.
Image
Image

DeepZen on ettevõte, mis loob heliraamatutes kasutatavaid arvutihääli, mis põhinevad inimnäitlejate tõelistel häältel. Kvaliteet on hirmutav – piisav alt hea, et seda tundide kaupa kuulata. Siin on trikk AI (tehisintellekti) komponent, mis suudab teksti lugeda ja konteksti põhjal õige emotsionaalse reaktsiooni järeldada. Seejärel paneb see selle emotsiooni hääle sisse.

See on muljetavaldav ja väga mugav. Kuid kas me tõesti tahame homogeniseeritud audioraamatu kogemust? Ja kuidas on nende häälnäitlejatega?

"Indiekirjastaja vaatenurgast on kõik, mis vähendab audioraamatute tootmise kulusid, väga huvitav," ütles sõltumatu väljaandja Carlile Media omanik Rick Carlile Lifewire'ile e-posti teel.

"Kuid see atraktsioon eeldab, et toode oleks sama kvaliteediga kui traditsiooniline jutustamine. Ma arvan, et me pole veel sada protsenti seal. Ärge saage minust valesti aru, DeepZen on hämmastav alt hea. See on tohutu läbimurre ning selle loojad väärivad tohutut kiitust ja edu. Kuid see pole veel täiuslik."

Heli, mis on "piisav alt hea"

Parim viis DeepZeni kvaliteedi mõistmiseks on proovide kuulamine. Kui te ei teaks, et need on arvutiga loodud, ei pruugi te isegi aru saada. Mõnda aega igatahes mitte. Oletame, et DeepZeni AI on täiuslik ja et see ei tõlgenda kunagi valesti emotsionaalseid noote, mida see peaks tabama.

Image
Image

Inimene suudab ka siis pakkuda nüansirikkamaid ja sageli üllatavamaid tõlgendusi. Näitleja võib sõnadesse panna ootamatu pöörde, mille peale arvuti kunagi isegi ei mõtleks. Ja tegelikult pole AI tõlgendus kindlasti veel nii hea kui professionaalsel häälnäitlejal.

"Kuna töötan filmide kallal ja viimati helijutustuse maailmas, kuigi mulle avaldab muljet tehisintellekt – tean kindl alt, et sellel on sügavad tähenduse sügavused, mida masin ei suuda tõlgendada, " professionaalne hääl näitleja Paul Cram rääkis Lifewire'ile e-posti teel.

"Kas seda kasutavad tundmatud autorid? Ma garanteerin, et see juhtub, sest see on "piisav alt hea"."

Piisav alt hea olemine koos mugavuse ja kulude kokkuhoiuga võib olla piisav indie-kirjastajate teenuse juurde suunamiseks.

"Heliraamatud võivad maksta kuni 500 dollarit ühe lõpetatud helitunni kohta (kuulsuste hääle puhul palju rohkem) ja see ei sisalda haldamise ja administraatori ajakulusid," ütleb Carlile. "Võimalus seda kulu poole võrra vähendada, laadides lihts alt üles käsikirja teenusepakkujale nagu DeepZen, on äärmiselt atraktiivne."

Rääkimisprobleemid

See pole veel nii lihtne kui häälnäitlejate vallandamine ja käsikirjade DeepZenisse üleslaadimine. Praegu on üks takistus heliraamatute tehisintellekti kõnelemisel ja see pärineb Amazonist.

Image
Image

"Praegu ei aktsepteeri ACX, iseväljaandja Audible'i ja Amazoni audioraamatute levitamise tee audioraamatuid, mida inimene pole salvestanud," ütleb Carlile.

Miks? Kvaliteet. Siin on KKK kirje veebisaidilt:

"Tekst kõneks või muud automaatsed salvestused pole lubatud. Kuuldavad kuulajad valivad nii materjali kui ka loo esitamiseks audioraamatud. Selle ootuse täitmiseks peab teie audioraamatu salvestama inimene."

See tähendab, et DeepZeni loodud audioraamatud on vähem alt praegu läbi. See on puhas spekulatsioon, kuid DeepZen näib olevat Amazoni jaoks päris hea omandamine, lastes tal teenust müüa ja hoida seda ainult Audible'i raamatute jaoks. Ja isegi kui seda ei juhtu, siis kui arvutiga loodud heliraamatute kvaliteet on sama hea, pole põhjust sellest reeglist erandit teha.

Kas kuulaksite hea meelega sel viisil tehtud audioraamatuid? Kui see juhtub, siis enamik inimesi isegi ei kahtlusta. Mõned võivad eelistada arvutiga loodud häälte täiuslikkust, sest nad on vabad vokaalsetest näpunäidetest ja harjumustest, mis võivad mõnikord tähelepanu kõrvale juhtida. Tehnoloogia sobib ka videomängude, tele- ja raadioreklaamide ning muude stsenaariumide jaoks, mille puhul palgatakse häälnäitleja.

DeepZeni tehnoloogia oleks ka suurepärane viis kirjutatud artiklitest automaatselt uudiste taskuhäälingusaadete loomiseks, mis võiksid olla kasulikud ka edasi-tagasi reisimiseks.

Ja kuidas on nende häälnäitlejatega? Noh, on vähem alt üks võimalus: nad võivad minna DeepZeni tööle.

Soovitan: