YouTube potrebbe presto duplicare automaticamente i video utilizzando l'intelligenza artificiale

click fraud protection

La funzione dovrebbe aiutare gli spettatori ad accedere a contenuti che altrimenti non sarebbero stati in grado di accedere.

Al VidCon di questa settimana, YouTube ha annunciato che sta integrando un nuovo strumento basato sull'intelligenza artificiale doppiare automaticamente i video in altre lingue, aiutando così i creatori e gli spettatori a superare la lingua barriera. La funzione è in lavorazione da anni come parte dell'incubatore Area 120 di Google per progetti sperimentali ed è stata annunciata lo scorso anno come parte dell'azienda maggiore spinta verso le funzionalità basate sull'intelligenza artificiale per tutti i suoi prodotti e servizi.

Chiamato "Aloud", il nuovo strumento consente ai creatori di farlo "doppia rapidamente e facilmente i loro video in più lingue, sbloccando conoscenze che oggi potrebbero essere intrappolate in una sola lingua." Google si aspetta che la funzione renda il doppiaggio più accessibile ai creatori che trovano troppo complicato o troppo costoso doppiare i propri video in più lingue. Per le persone che si chiedono come funziona, il sito ufficiale di Aloud

dice che lo strumento prima trascrive il video e consente al creatore di rivedere e modificare la trascrizione. Quindi traduce e doppia il video nella lingua di destinazione prima di essere pubblicato dal creatore.

In una dichiarazione a Il limite, Amjad Hanif di YouTube ha affermato che la funzione è attualmente in fase di test con centinaia di creator in tutto il mondo. Ha aggiunto che attualmente supporta solo poche lingue, con altre che dovrebbero essere aggiunte in futuro. L'azienda aveva prima annunciato che Aloud sarà disponibile solo in inglese, spagnolo e portoghese al momento del lancio, con hindi, bahasa-indonesia e altre lingue che dovrebbero essere aggiunte all'elenco nel prossimo futuro.

Ad alta voce è un fantastico uso dell'intelligenza artificialee uno che dovrebbe aiutare i creatori a raggiungere un pubblico più ampio. Secondo Hanif, la società non solo sta lavorando per far suonare le tracce audio tradotte come la voce del creatore, ma incorpora anche più espressione nel contenuto doppiato. Inoltre, sta anche cercando di introdurre la sincronizzazione labiale per rendere i video più naturali. Tuttavia, queste funzionalità arriveranno solo il prossimo anno, quindi per ora i video rimarranno non sincronizzati con l'audio e la voce doppiata suonerà relativamente meccanica.