YouTube zou binnenkort automatisch video's kunnen dubben met behulp van AI

click fraud protection

De functie zal naar verwachting kijkers helpen toegang te krijgen tot inhoud waar ze anders niet toe in staat zouden zijn geweest.

Tijdens VidCon deze week kondigde YouTube aan dat het een nieuwe AI-aangedreven tool integreert die dat wel zal doen automatisch video's in andere talen dubben, waardoor makers en kijkers de taal kunnen beheersen barrière. De functie is al jaren in de maak als onderdeel van Google's Area 120-incubator voor experimentele projecten en werd vorig jaar aangekondigd als onderdeel van de meer push in AI-gestuurde functies voor al haar producten en diensten.

De nieuwe tool, 'Aloud' genaamd, stelt videomakers in staat om "hun video's snel en eenvoudig in meerdere talen dubben, waardoor kennis wordt ontsloten die tegenwoordig in één enkele taal vastzit." Google verwacht dat de functie nasynchronisatie toegankelijker maakt voor videomakers die het te ingewikkeld of te duur vinden om hun video's in meerdere talen te dubben. Voor mensen die zich afvragen hoe het allemaal werkt, de officiële website van Aloud

zegt dat de tool eerst de video transcribeert en de maker in staat stelt de transcriptie te bekijken en te bewerken. Vervolgens wordt de video vertaald en nagesynchroniseerd in de doeltaal voordat deze door de maker wordt gepubliceerd.

In een verklaring aan De rand, zei Amjad Hanif van YouTube dat de functie momenteel wordt getest met honderden videomakers over de hele wereld. Hij voegde eraan toe dat het momenteel slechts een paar talen ondersteunt, en dat er naar verwachting in de toekomst meer zullen worden toegevoegd. Het bedrijf had eerder aangekondigd dat Aloud bij de lancering alleen beschikbaar zal zijn in het Engels, Spaans en Portugees, terwijl Hindi, Bahasa-Indonesië en andere talen naar verwachting in de nabije toekomst aan de lijst zullen worden toegevoegd.

Hardop is een super cool gebruik van AI, en een die videomakers zou moeten helpen een breder publiek te bereiken. Volgens Hanif werkt het bedrijf er niet alleen aan om de vertaalde audiotracks te laten klinken als de stem van de maker, maar ook om meer expressie in de nagesynchroniseerde inhoud op te nemen. Daarnaast wil het ook lipsynchronisatie introduceren om de video's er natuurlijker uit te laten zien. Die functies komen echter pas volgend jaar, dus voorlopig blijven de video's niet synchroon met de audio en klinkt de nagesynchroniseerde stem relatief mechanisch.