Alfabēta Tacotron 2 teksta pārvēršanas runā dzinējs izklausās gandrīz neatšķirami no cilvēkiem

click fraud protection

Alphabet AI pētniecības laboratorija izstrādāja Tacotron 2 — teksta pārvēršanas runā sistēmu, kas rada audio, kas nav atšķirams no cilvēka.

Ir izstrādāts Alphabet meitasuzņēmums DeepMind WaveNetoktobrī, neironu tīkls, kas nodrošina Google asistenta runas sintēzi. Tas spēj iegūt labākus un reālistiskākus audio paraugus nekā meklēšanas giganta iepriekšējais teksta pārvēršanas runā sistēma, un, vēl jo vairāk, tā ģenerē neapstrādātu audio — nevis savienotas skaņas no balss aktieri. Tagad Alfabēta pētnieki ir izstrādājuši jaunu versiju Tacotron 2, kas izmanto vairākus neironu tīklus, lai radītu runu, kas gandrīz neatšķiras no cilvēka.

Šeit ir paraugs. Pirmais tika ģenerēts, izmantojot Tacotron 2, bet otrais ir balss aktieris:

[audio wav=" https://static1.xdaimages.com/wordpress/wp-content/uploads/2017/12/washington_gen.wav"][/audio]

[audio wav=" https://static1.xdaimages.com/wordpress/wp-content/uploads/2017/12/washington_gt.wav"][/audio]

Tacotron 2 sastāv no diviem dziļiem neironu tīkliem. Kā aprakstīts šomēnes publicētajā pētnieciskajā dokumentā, pirmais pārvērš tekstu spektrogrammā, audio frekvenču spektra vizuālā attēlojumā. Otrais - DeepMind's WaveNet - interpretē diagrammu un ģenerē atbilstošus audio elementus. Rezultāts ir visaptverošs dzinējs, kas var uzsvērt vārdus, pareizi izrunāt vārdus, uztvert sintaktisko. norādes (t.i., uzsverot vārdus, kas ir slīprakstā vai ar lielo burtu), un mainīt veidu, kā tas izrunā, pamatojoties uz pieturzīmes.

Nav skaidrs, vai Tacotron 2 nonāks pie tādiem lietotājiem paredzētiem pakalpojumiem kā Google palīgs, taču tas būtu līdzvērtīgs kursam. Neilgi pēc DeepMind WaveNet pētījuma publicēšanas Google izlaida mašīnu uz mācībām balstīta runas atpazīšana vairākās valodās ar Asistentu darbināmos viedtālruņos, skaļruņos, un tabletes.

Ir tikai viena problēma: šobrīd Tacotron 2 sistēma ir apmācīta atdarināt vienu sievietes balsi. Lai ģenerētu jaunas balsis un runas modeļus, Google būs vēlreiz jāapmāca sistēma.


Takotrons 2