Karlsruher Institut für Technologie

Tiefsee-Test am Titanic-Wrack: Neue Technologie könnte Videokommunikation verbessern

Forschende des Karlsruher Instituts für Technologie (KIT) und der Carnegie Mellon University (CMU) haben eine Methode entwickelt, mit der Videokonferenzen über geringe Bandbreiten übertragen und damit auch unter extremen Bedingungen genutzt werden können. Getestet haben sie diese jetzt während eines Tauchgangs zum Wrack der Titanic in 4.000 Metern Tiefe im Nordatlantik.

Tiefsee-Test am Titanic-Wrack(Bild: Alex Waibel)

„Daten aus vier Kilometern Tiefe durch Salzwasser hindurch verlustfrei zu übertragen, ist extrem schwierig“, beschreibt Professor Alex Waibel, der am KIT und an der CMU zur Sprachübersetzung forscht, die Herausforderung. Denn die natürlichen Gegebenheiten ließen eine Übertragung vom Tauchboot an die Meeresoberfläche zum Mutterschiff nur mit Sonar zu, da Radio-Kommunikation im Salzwasser nicht funktioniert.

Anzeige

Die Forschenden haben synthetische Methoden entwickelt, mit denen Videos aus Text rekonstruiert werden können. Die Tonaufnahme wird zunächst im U-Boot in Text umgewandelt, dann per Sonar-Schallimpuls nach oben übermittelt und dort aus dem Text als Video rekonstruiert. „Im Video ist dann eine synthetische Stimme zu hören, die auf die Stimme des Sprechers übertragen wird, so dass sie wie die Stimme des Sprechers klingt. Zudem wird die Video-Synthese so gesteuert, dass die Lippen des Sprechers sich dabei synchron mit dem Ton bewegen“, erläutert Waibel, der an Spracherkennung, Sprachverarbeitung und Sprachübersetzung forscht.

Methode erlaubt Videokonferenzen bei geringer Bandbreite

Im U-Boot setzten die Forschenden einen Laptop ein, der zunächst die Sprache unterschiedlicher Sprechenden im Dialog in Text verwandelt. Selektierte Textfragmente können dann via Sonar an die Oberfläche entsandt werden. Dort wird der Text dann wieder in ein Video verwandelt.

(Bild: Alex Waibel)

Neu ist dabei die Umwandlung einer synthetischen neutralen Stimme in die individuellen Stimmen der jeweiligen Sprechenden und die Video-Synthese, die lippensynchron das Video der jeweiligen Sprechenden im Dialog synthetisiert. Die Methode erlaubt es, Videokonferenzen über eine geringe Bandbreite zu übertragen: „Das wird in Zukunft die Kommunikation in gesprochener Sprache erleichtern“, sagt Waibel. Sie eignet sich aber auch für die Synthese von Videos in einer anderen Sprache oder für die lippensynchrone Vertonung von Videos.

Technologie basiert auf Pionierarbeit zur Sprachübersetzung am KIT

Die Technologie, die Waibel am Wrack der Titanic getestet hat, baut auf seiner Pionierarbeit in der Sprachübersetzung auf. Waibel entwickelte unter anderem den „Lecture Translator“, der am KIT im Einsatz ist und in Vorlesungen automatisch den Vortrag des Lehrenden aufzeichnet und die Sprachsignale simultan in Schriftform ins Englische übersetzt. Die Studierenden können der Vorlesung so über Laptop, Smartphone oder Tablet folgen.

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.