Der Traum einer “lingua franca”, einer Universalsprache, die sämtliche andere Mundarten ersetzen sollte, um die internationale Verständigung zu fördern, wurde schon im 17. Jahrhundert geträumt. Und der Mathematiker Leibniz versuchte sich sogar an einem Wörterbuch mit Zahlencode.

Übrigens erfand Leibniz das Dualsystem zwischen 0 und 1, besser bekannt als binären Code, die Grundlage aller Informationstechnologie. Aber erst im 20. Jahrhundert war die Technik so weit vorangeschritten, dass sie maschinelle Übersetzungen ermöglichte.

Frühe Grundlagen

1933 patentierten Georges Artsouni und Petr Smirnov-Troyanskij jeweils zwei verschiedene Vorläufer der Maschinenübersetzung. Inbesondere Troyanskijs Ideen waren weitreichend, wenn auch nie ein Prototyp von seinem Patent gebaut wurde. So befand es Troyanskij für notwendig, in drei Schritten an der Übersetzung zu arbeiten: mit einem Editor in der Ausgangssprache, der maschinellen Übersetzung und einem Editor der Zielsprache.

Universalsprache basierend auf Mathematik

Schön früh träumten Mathematiker von einer „Universalsprache“

Zeitgleich patentierte der Franko-Armenier Georges Artsouni eine Art Papierspeicher, welche ähnlich einem elektronischen Wörterbuch Übersetzungenin mehrere Sprache anzeigte.

Erste Bemühungen zwischen Linguisten und Mathematikern

Sowohl in den Vereinigten Staaten als auch in Russland fanden in den frühen 50ern und 60ern des 20. Jahrhunderts Studien zur Maschinenübersetzung statt. Dabei stach vor allem der Mathematiker Warren Weaver hervor, welcher erkannte, dass es, um maschinell übersetzen zu können, einer logischen Erforschung der Sprache und ihrer Grundlagen bedurfte. Dafür wollte er auch im Krieg entwickelte Dechiffriertechniken und statistische Methoden zum Einsatz bringen.

Computerlinguistik

Die Computerlinguistik geht auf die frühen 60er Jahre zurück und stellt eine Schnittstelle zwischen der Linguistik und der Informatik dar. Die Sprache wird erst syntaktisch, semantisch und morphologisch analysiert, bevor sie in Algorithmen verwandelt werden kann.

Heutzutage wird Computerlinguistik beispielsweise bei Korrekturprogrammen und automatischer Textherstellung angewendet.

Formen der Maschinenübersetzung

Die Maschinenübersetzung selbst setzt sich zumeist aus zweisprachigen Wörterbüchern mit Grammatikkorrekturen zusammen. Die direkte Maschinenübersetzung arbeitet beispielsweise mit einer Wort-für-Wort-Übersetzung, welche im Nachhinein grammatikalisch an die Zielsprache angepasst wird. Dabei handelt es sich um die älteste Form der Maschinenübersetzung.

Übersetzungen mit dem Rechner

Es gibt unterschiedliche Arten von Maschinenübersetzung

Die Interlingua-Methode arbeitet mit einer Zwischensprache und nimmt auch eine grammatische Analyse der Ausgangssprache vor. Die EBMT-Methode wiederum arbeitet mit einem Übersetzungsspeicher und generiert Übersetzungen aus den Sprachenpaaren, die am häufigsten wiederkehren.

Nicht zur Maschinenübersetzung zu zählen sind die sogenannten CAT-Tools, kurz für Computer-Aided Translation, welche Übersetzern heutzutage als Arbeitshilfe zur Verfügung stehen und es erlauben, ein eigene Glossar zu erfassen und häufig wiederkehrende Übersetzungen abspeichern und dem Übersetzer später zur Verfügung stellen.