YouTube pourrait bientôt dupliquer automatiquement des vidéos à l'aide de l'IA

click fraud protection

Cette fonctionnalité devrait aider les téléspectateurs à accéder à du contenu auquel ils n'auraient pas pu accéder autrement.

À VidCon cette semaine, YouTube a annoncé qu'il intégrait un nouvel outil alimenté par l'IA qui double automatiquement les vidéos dans d'autres langues, aidant ainsi les créateurs et les spectateurs à maîtriser la langue barrière. La fonctionnalité est en préparation depuis des années dans le cadre de l'incubateur Area 120 de Google pour les projets expérimentaux, et a été annoncée l'année dernière dans le cadre du poussée accrue vers les fonctionnalités pilotées par l'IA pour tous ses produits et services.

Appelé "Aloud", le nouvel outil permet aux créateurs de "Dupliquez rapidement et facilement leurs vidéos dans plusieurs langues, libérant ainsi des connaissances qui pourraient être piégées dans une seule langue aujourd'hui." Google s'attend à ce que cette fonctionnalité rende le doublage plus accessible aux créateurs qui trouvent trop compliqué ou trop coûteux de doubler leurs vidéos en plusieurs langues. Pour les personnes qui se demandent comment tout cela fonctionne, le site officiel d'Aloud

dit que l'outil transcrit d'abord la vidéo et permet au créateur de revoir et de modifier la transcription. Il traduit et double ensuite la vidéo dans la langue cible avant d'être publiée par le créateur.

Dans une déclaration à Le bord, Amjad Hanif de YouTube a déclaré que la fonctionnalité est actuellement testée avec des centaines de créateurs à travers le monde. Il a ajouté qu'il ne prend actuellement en charge que quelques langues, et que d'autres devraient être ajoutées à l'avenir. L'entreprise avait auparavant annoncé qu'Aloud ne sera disponible qu'en anglais, espagnol et portugais au lancement, l'hindi, le bahasa-indonésien et d'autres langues devant être ajoutés à la liste dans un proche avenir.

à voix haute est un utilisation super cool de l'IA, et qui devrait aider les créateurs à toucher un public plus large. Selon Hanif, la société s'efforce non seulement de faire sonner les pistes audio traduites comme la voix du créateur, mais également d'incorporer plus d'expression dans le contenu doublé. En outre, il cherche également à introduire la synchronisation labiale pour rendre les vidéos plus naturelles. Cependant, ces fonctionnalités n'arriveront que l'année prochaine, donc pour l'instant, les vidéos resteront désynchronisées avec l'audio, et la voix doublée aura un son relativement mécanique.