Alphabetov Tacotron 2 mehanizam za pretvaranje teksta u govor zvuči gotovo nerazlučivo od ljudi

Alphabetov istraživački laboratorij za umjetnu inteligenciju razvio je Tacotron 2, sustav za pretvaranje teksta u govor koji proizvodi zvuk koji se ne razlikuje od ljudskog.

Alphabetova podružnica, DeepMind, razvijena WaveNet, neuronske mreže koja pokreće sintezu govora Google pomoćnika, u listopadu. Sposoban je za bolje i realističnije audio uzorke od prethodnog pretraživačkog diva sustav za pretvaranje teksta u govor, i štoviše, generira sirovi zvuk -- ne spojene zvukove iz glasovni glumci. Sada su istraživači u Alphabetu razvili novu verziju, Tacotron 2, koja koristi višestruke neuronske mreže za proizvodnju govora koji se gotovo ne razlikuje od ljudskog.

Evo uzorka. Prvi je generiran pomoću Tacotrona 2, a drugi je glasovni glumac:

[audio wav=" https://static1.xdaimages.com/wordpress/wp-content/uploads/2017/12/washington_gen.wav"][/audio]

[audio wav=" https://static1.xdaimages.com/wordpress/wp-content/uploads/2017/12/washington_gt.wav"][/audio]

Tacotron 2 sastoji se od dvije duboke neuronske mreže. Kako to opisuje istraživački rad objavljen ovog mjeseca, prvi prevodi tekst u spektrogram, vizualni prikaz spektra audio frekvencija. Drugi -- DeepMind's WaveNet -- tumači grafikon i generira odgovarajuće audio elemente. Rezultat je end-to-end motor koji može naglašavati riječi, ispravno izgovarati imena, pokupiti sintaktičke naznake (tj. naglašavanje riječi koje su pisane kurzivom ili velikim slovima) i mijenja način na koji se izgovara na temelju interpunkcija.

Nije jasno hoće li se Tacotron 2 probiti do korisničkih usluga kao što je Google Assistant, ali to bi bilo normalno. Ubrzo nakon objave DeepMindovog WaveNet istraživanja, Google je izbacio stroj prepoznavanje govora na više jezika koje pokreće učenje na pametnim telefonima, zvučnicima, i tablete.

Postoji samo jedan problem: trenutno je sustav Tacotron 2 osposobljen za oponašanje jednog ženskog glasa. Kako bi generirao nove glasove i govorne obrasce, Google bi trebao ponovno uvježbati sustav.


Takotron 2