Scrubs und der Schweizer Alpenclub

PCtipp: Also haben marktwirtschaftliche Kriterien ...

PCtipp: Also haben marktwirtschaftliche Kriterien bei diesem Projekt von Anfang an eine Rolle gespielt?
Volk: Bei diesem Projekt auf jeden Fall. Es wurde von einer Untertitelfirma gesponsert – und zwar an der Universität Stockholm, wo ich von 2003 bis 2008 gearbeitet habe. Da sich unser System bewährt hat, entstand daraus die Idee, unsere Entwicklung auch anderen Untertitelfirmen anzubieten. Dafür haben wir vor zwei Jahren das Unternehmen TextShuttle gegründet.
PCtipp: Welche TV-Sendungen werden mit Ihren Systemen übersetzt?
Volk: Inbesondere Fernsehserien, beispielsweise Scrubs aber auch Sendungen des Discovery Channel. Die Serien liegen in aller Regel in Englisch vor und die Firma stellt manuell schwedische Untertitel dazu her. Daraus werden dann mit unserem System dänische und norwegische Untertitel produziert.
PCtipp: Warum keine deutschen Untertitel?
Volk: Bei deutschen Untertiteln sind wir momentan noch nicht vertreten. Es beginnt jetzt aber im April ein EU-Projekt, an dem wir beteiligt sind. Dort wird es auch um deutsche Übersetzungen gehen. In Deutschland ist aber im Fernsehen nicht ganz so viel untertitelt - hauptsächlich handelt es sich hier um Untertitel für Gehörgeschädigte. In Skandinavien gibt es im TV hingegen Untertitel für Hörende, so dass dort der Markt grösser ist.
PCtipp: Wie funktioniert die maschinelle Übersetzung von Untertiteln konkret?
Volk: Zunächst einmal muss man sich die Frage stellen, wie die Technologie dahinter aussieht bzw. wie das System der statistischen maschinellen Übersetzung funktioniert. Dies lässt sich intuitiv und einfach so beantworten: Man nimmt grosse Textmengen, die von Menschen übersetzt wurden. Bei dem Projekt in Stockholm hatten wir beispielsweise fünf Millionen Untertitel zur Verfügung. Das sind 50 Millionen schwedische, dänische und norwegische Wörter. Der Computer errechnet automatisch die entsprechenden Wörter – also etwa: welches schwedische entspricht welchem dänischen Wort. Danach gruppiert der Rechner jene Wörter die zusammengehören, so dass Wortsequenzen entstehen. Anschliessend wird ermittelt, wie wahrscheinlich es ist, dass eine schwedische mit der entsprechenden dänischen Wortfolge übersetzt wird. Dann wird bei der eigentlichen Übersetzung der neue Untertitel in diese Wortfolgen zerlegt und das entsprechende Material in der Zielsprache zusammengestellt. Mittels einem statistischen Verfahren wird berechnet, welche Übersetzungsvariante die Wahrscheinlichste bzw. Flüssigste und Natürlichste ist. Es wird hierbei überhaupt keine linguistische Analyse gemacht. Das ganze Verfahren ist ein Recycling-Prozess, der auf Statistik beruht.
PCtipp: Kontrolliert die Ergebnisse letzten Endes nochmal ein Mensch oder ist alles automatisiert?
Volk: Am Schluss sieht sich die Ergebnisse nochmal ein Übersetzer an, der auf Untertitel spezialisiert ist. Der überprüft, ob es korrekt übersetzt ist. Wenn es falsch ist, muss er es entweder abändern oder manchmal komplett neu übersetzen.



Kommentare
Es sind keine Kommentare vorhanden.