YouTube könnte bald Videos mithilfe von KI automatisch überspielen

Die Funktion soll den Zuschauern den Zugriff auf Inhalte erleichtern, auf die sie sonst keinen Zugriff hätten.

Auf der VidCon diese Woche gab YouTube bekannt, dass es ein neues KI-gestütztes Tool integriert, das dies tun wird Videos automatisch in andere Sprachen synchronisieren und so Erstellern und Zuschauern helfen, die Sprache zu überwinden Barriere. Das Feature ist seit Jahren im Rahmen von Googles Area 120-Inkubator für experimentelle Projekte in Arbeit und wurde letztes Jahr im Rahmen des Unternehmens angekündigt verstärkter Vorstoß in KI-gesteuerte Funktionen für alle seine Produkte und Dienstleistungen.

Das neue Tool mit dem Namen „Aloud“ ermöglicht es Erstellern „Sie können ihre Videos schnell und einfach in mehrere Sprachen synchronisieren und so Wissen freischalten, das heute möglicherweise in einer einzigen Sprache gefangen ist.“ Google geht davon aus, dass die Funktion das Überspielen für YouTuber einfacher machen wird, denen es zu kompliziert oder zu teuer ist, ihre Videos in mehrere Sprachen zu synchronisieren. Für Leute, die sich fragen, wie das alles funktioniert, die offizielle Aloud-Website

sagt dass das Tool das Video zunächst transkribiert und es dem Ersteller ermöglicht, die Transkription zu überprüfen und zu bearbeiten. Anschließend wird das Video übersetzt und in die Zielsprache synchronisiert, bevor es vom Ersteller veröffentlicht wird.

In einer Stellungnahme dazu Der RandAmjad Hanif von YouTube sagte, dass die Funktion derzeit mit Hunderten von YouTubern auf der ganzen Welt getestet wird. Er fügte hinzu, dass derzeit nur wenige Sprachen unterstützt werden und dass in Zukunft weitere hinzukommen sollen. Das Unternehmen hatte früher angekündigt dass Aloud zum Start nur auf Englisch, Spanisch und Portugiesisch verfügbar sein wird, wobei Hindi, Bahasa-Indonesisch und andere Sprachen voraussichtlich in naher Zukunft zur Liste hinzugefügt werden.

Laut ist ein Super cooler Einsatz von KI, und eines, das den YouTubern helfen soll, ein breiteres Publikum zu erreichen. Laut Hanif arbeitet das Unternehmen nicht nur daran, die übersetzten Audiospuren wie die Stimme des Schöpfers klingen zu lassen, sondern auch mehr Ausdruck in den synchronisierten Inhalt zu integrieren. Darüber hinaus ist die Einführung einer Lippensynchronisation geplant, um den Videos ein natürlicheres Aussehen zu verleihen. Diese Funktionen werden jedoch erst im nächsten Jahr verfügbar sein, sodass die Videos vorerst nicht mit dem Ton synchronisiert sein werden und die synchronisierte Stimme relativ mechanisch klingen wird.