Sprechen sie mit uns +43 1 505 9744 0

Maschinelle Übersetzung

Maschinelle Übersetzung (mit MÜ oder MT vom Englischen „machine translation“ abgekürzt) bezeichnet die Übersetzung von Texten aus der Quellsprache (Fachbegriff aus der Maschinellen Übersetzung für die Ausgangssprache) in eine Zielsprache mit Hilfe eines Computerprogramms.

Die Maschinelle Übersetzung ist ein Teilbereich der künstlichen Intelligenz. Während die Humanübersetzung Gegenstand der angewandten Sprachwissenschaft ist, wird die Maschinelle Übersetzung vor allem in der Informatik und Computerlinguistik erforscht.

Die Maschinelle Übersetzung wird qualitativ immer besser, ist jedoch immer noch nicht gut genug, als dass sie die Humanübersetzung ersetzen könnte. Um dieselbe Qualität wie bei einer Humanübersetzung zu erzielen, ist eine Vorbereitung der Daten (Pre-Editing) und eine Korrektur der Übersetzung (Post-Editing) erforderlich. Eine reine Maschinelle Übersetzung wird heute vor allem bei Echtzeit-Texten (Foren, Chats) eingesetzt, bei denen es nicht um die sprachliche Qualität, sondern um das reine Erfassen von Informationen geht.

Es gibt zwei grundlegende Verfahren der Maschinellen Übersetzung:

  • Regelbasierte Maschinelle Übersetzung (zum Beispiel Yahoo Babelfish): Dies ist die älteste Methode der MÜ und beruht auf grammatikalischen Regeln und linguistischen Terminologiedefinitionen. Bei der Übersetzung wird der Ausgangstext satzweise analysiert und in seine grammatikalischen Bestandteile zerlegt. Anschließend wird die Satzstruktur in die Zielsprache übertragen und schließlich werden die einzelnen Wörter übersetzt und in die übertragene Struktur eingefügt. Die regelbasierte Maschinelle Übersetzung gilt immer nur für ein bestimmtes Sprachenpaar, da die grammakalischen Regeln immer nur auf eine bestimmte Sprache zutreffen.
  • Systembasierte Maschinelle Übersetzung (zum Beispiel Google Translator, Bing Microsoft Translator): Dieser neuere Ansatz versucht nicht, sprachliche Regeln auf einen Ausgangstext anzuwenden. Stattdessen werden zweisprachige Textmengen gespeichert und segmentiert. Bei der Übersetzung werden die Segmente auf entsprechende Muster in der Zielsprache untersucht und diese Muster nach statistischen Wahrscheinlichkeitsregeln zusammengesetzt. Da keine Sprachabhängigkeit vorliegt, kann die systembasierte MÜ für unterschiedliche Sprachen verwendet werden, man braucht aber sehr große zweisprachige Textmengen. Mehr dazu hier.

Heutzutage kommt meist die statistische Maschinelle Übersetzung zum Einsatz. Um dabei eine gute Qualität der Übersetzung zu erzielen, muss zunächst eine große Menge an zweisprachigem Datenmaterial vorhanden sein, mit dem eine Engine des MÜ-Systems „trainiert“ wird. Im Anschluss an die Übersetzung wird diese von einem Post-Editor korrigiert. Die meisten CAT-Tools bieten mittlerweile die Funktion, MÜ-Plugins (zum Beispiel GoogleMT oder iTranslate4.eu) zu integrieren, sodass das Post-Editing in der gewohnten Umgebung ganz ähnlich wie beim Lektorat stattfinden kann. Der Post-Editor bekommt den maschinell übersetzten Text und muss ihn in Bezug auf die inhaltliche Übereinstimmung mit dem Quelltext, grammatikalisch, syntaktisch und stilistisch anpassen.

 

Maschinelle Übersetzung – ja oder nein?

Ob der Einsatz von Maschineller Übersetzung sinnvoll ist, hängt von vielen Faktoren ab, zum Beispiel von der Textsorte, dem Fachbereich, dem finanziellen und zeitlichen Rahmen und den Qualitätsansprüchen. Die Vor- und Nachteile Maschineller Übersetzung müssen also abgewogen und mit den erforderlichen Ansprüchen verglichen werden. Daher werden die wichtigsten Eigenschaften maschineller Übersetzung hier noch einmal zusammengefasst:

  • Kostenersparnis: Abgesehen von den Anschaffungs- und Wartungskosten fallen keine Übersetzungskosten an einen Humanübersetzer an. Die Kosten, die für den Post-Editor berücksichtigt werden müssen, liegen unter jenen für einen Übersetzer.
  • Zeitersparnis: MÜ ermöglicht die Übersetzung großer Textmengen in einem Bruchteil der Zeit, die ein Humanübersetzer dafür benötigen würde. Es muss aber genügend Zeit für das Trainieren sogenannter Engines und für das Post-Editing eingerechnet werden.
  • Vorhandensein großer Textkorpora: Um mit der statistischen Maschinellen Übersetzung eine Qualität zu erzielen, die für ein effizientes Post-Editing gut genug ist, braucht man große zweisprachige Textmengen, mit denen die Engine eines MÜ-Systems vorab „trainiert“ werden.
  • Qualität: Die Qualität der MÜ hängt davon ab, wie viel zweisprachiges Datenmaterial vorhanden ist und wie genau das Post-Editing betrieben wird.
  • Geeignete Textsorten: Die besten Ergebnisse liefert Maschinelle Übersetzung bei großen Textmengen und standardisierten Texten mit vielen Wiederholungen, zum Beispiel bei Dokumentationen, Handbüchern oder Betriebsanleitungen.

Um herauszufinden, inwieweit Maschinelle Übersetzung die Ansprüche des professionellen Übersetzungsmarktes tatsächlich erfüllt, hat Interlingua ein Pilotprojekt durchgeführt. Mehr dazu erfahren Sie hier.