YouTube plant, den Ton von Videos automatisch in andere Sprachen zu übersetzen, um Zuschauern weltweit passende Synchronspuren anzubieten.

YouTube

Hierfür setzt das Unternehmen auf Künstliche Intelligenz und synthetische Stimmen. Die automatischen Übersetzungen basieren auf den Vorarbeiten des Startups Aloud, das bereits einen ähnlichen Dienst im Early-Access-Programm anbietet. Aloud transkribiert die zu übersetzenden Videos, Videomacher überprüfen den Text auf Fehler, und der Dienst übersetzt den erkannten Text, erzeugt eine Tonspur und synchronisiert sie mit dem Videoinhalt.

Auf der Webseite von Aloud sind bereits Hörbeispiele der synthetischen Stimmen in verschiedenen Sprachen verfügbar. YouTube plant, diese neue Funktion im kommenden Jahr einzuführen, zunächst jedoch mit einem begrenzten Sprachverständnis. Langfristig möchte YouTube auch lippensynchrone Tonspuren generieren und Stimmen anbieten, die den Originalstimmen der Videomacher ähneln.

 

Das eingebettete Erklärvideo oben bietet bereits fünf Tonspuren an, die über das Zahnrad im YouTube-Video ausgewählt werden können und einen Ausblick darauf geben, was im kommenden Jahr zum Standard werden könnte.