logo

Lernen

Hier findest du Einführungsmaterial zum literarischen Schreiben mit KI. Die Artikel geben einen theoretischen Überblick über verschiedene Themenfelder und führen an Fragestellungen und Kontexte heran.

Wie funktioniert Übersetzung mit KI?

Die ersten Tools, die in der Lage waren, Texte zu übersetzen, arbeiteten auf Wortebene und mit grammatikalisch gesetzten Regeln, wie beispielsweise der Konjugation von Verben oder der Deklination von Adjektiven. Kritisiert wurde ihre Übersetzungsleistung dahingehend, dass semantische oder formale Kontexte, die über grammatische Regeln  hinausgingen, wenig berücksichtigt wurden. Stattdessen konnte lediglich Wort für Wort übersetzt werden. Auch kompliziertere Satzstrukturen konnten oft nicht gut entschlüsselt und sinngemäß in die andere Sprache übertragen werden. Es handelte sich folglich eher um elektronische Wörterbücher. Insbesondere literarische Texte können jedoch schlecht Wort für Wort übersetzt werden, da nicht nur Inhalt, sondern auch Form in eine andere Sprache überführt werden muss. Ebenso müssen bei literarischen Übersetzungen immer auch kulturelle Kontexte, Poetisierungen sowie Sprachnuancierungen und stilistische Eigenheiten berücksichtigt werden.

Durch die Einführung von Machine Learning (maschinelles Lernen) hat sich die Funktionsweise der Tools verändert: Maschinelles Lernen besteht darin, Daten  für einen bestimmten Task (Aufgabe, gemeint ist hier: übersetzen) zu prüfen, Muster in diesen Daten zu erkennen und die gefundenen Muster zu verknüpfen, sodass dadurch sprachliche Regeln erkannt werden können. Die Daten bestehen bei Übersetzungstools mitunter aus bereits bestehenden Übersetzungen aus Übersetzungsspeichern [1] und mehrsprachigen Terminologiedatenbanken. Die so gewonnenen Erkenntnisse werden genutzt, um festzulegen, wie der Computer den Task ausführt. Wenn der Computer den Task anschließend besser ausführen kann, war das Machine Learning erfolgreich. Die sprachlichen Regeln sind demzufolge im Machine Learning (ungleich wie bei den ersten Übersetzungs-Tools) keine bereits festgelegte und von Menschen in die Software eingespeiste Grammatik, sondern durch Muster im Datensatz erkannte sprachliche Regeln. Dadurch können Abweichungen meist besser beachtet werden. Innerhalb des Machine Learnings gibt es zwei verschiedene Funktionsweisen:

1) Google Übersetzer startete 2006 als Statistical Machine Translation (SMT): Das Tool folgt nicht mehr nur vorgegebenen  Regeln, sondern nutzt maschinelles Lernen, um eine Vielzahl von möglichen Übersetzungen für einen Satz zu generieren. Danach wird die statistisch am genauesten passende Übersetzung ausgewählt – gestützt auf die Wahrscheinlichkeit, mit der Wörter und Sätze in der Ausgangs- und der Zielsprache auftreten. Die Form hat keine linguistische Grundlage, liest sich aber flüssiger als eine regelbasierte maschinelle Übersetzung. Allerdings fehlt es ihr oft an innerer Logik und Stringenz.

2) Seit 2016 wird vornehmlich Neural Machine Translation (NMT) genutzt und ist die erste tatsächliche Übersetzungs-KI. Auch NMT basiert auf gesammelten Daten, diese werden jedoch anders verarbeitet: Ein künstliches neuronales Netzwerk macht es der Software möglich, auch kontextbezogene Verbindungen zwischen Wörtern und Phrasen zu ziehen. Dies funktioniert durch eine neue Zahlensprache, die bei der Übersetzung hilft. Eingegebene Wörter werden in eine Zahl codiert, im neuronalen Netzwerk findet das System die entsprechenden gelernten Sprachregeln: Welche Wörter und welche Kontexte sind basierend auf bisherigen Datensätzen entscheidend? Bei NMT wird das Entziffern von Kontext „Ausrichtung“ genannt, dies geschieht im sog. Attention-Mechanismus (https://ai-labkit.de/lernen/?post=large-language-models-ein-%C3%9Cberblick) [2], der im System zwischen Verschlüsselung und Entschlüsselung verortet ist. Die Entschlüsselung besteht darin, dass die Zahlen, die in der Zielsprache gefunden wurden, in tatsächliche Wörter rückgeführt werden.

Für beide Versionen von Machine Learning ist eine kontinuierliche Überarbeitung und Erweiterung der Daten unabdingbar – je mehr von Menschen übersetzt und verbessert wird, desto feiner können Unterscheidungen im Ton werden: Eine Übersetzungs-KI ist nicht in der Lage, von selbst einen Kontext zu erkennen, der nicht von einem Menschen eingespeist und für zukünftige Übersetzungen gespeichert wurde [3].

Einzelnachweise

1  Übersetzungsspeicher sind Datenbanken innerhalb einer Software, in welche bereits existente und strukturierte Humanübersetzungen gespeichert sind. Es gibt darunter Speicher, bei welchen die gespeicherten Segmente zusammengehörige Texte von der Quell- und Zielsprache sind, dadurch steht jeder übersetzte Satz im Kontext. Somit können Übersetzungsspeicher hilfreich sein, um per Machine Learning Häufigkeiten und teilweise auch Kontexte bestimmter Formulierungen in der Übersetzung zu erkennen.

2 Vgl. Ashish Vaswani, Noam Shazeer, Niki Parmar, Jakob Uszkoreit, Llion Jones, Aidan N. Gomez, Lukasz Kaiser, Illia Polosukhin: Attention is all you need. In: Advances in Neural Information Processing Systems (2017). S. 5998–6008.

3 Vgl. Jason Brownlee: A Gentle Introduction to Neural Machine Translation. In: Deep Learning for Natural Language Processing (2017). A Gentle Introduction to Neural Machine Translation - MachineLearningMastery.com (22.05. 2024); Jiatao Gu, Yong Wang, Kyunghyun Cho, Victor O.K. Li: Improved Zero-shot Neural Machine Translation via Ignoring Spurious Correlations. In: Proceedings of the 57th Annual Meeting of the Association for Computational Linguistics. S. 1258–1268. Florenz: Association for Computational Linguistics 2019. https://aclanthology.org/P19-1121/. (06.05.2024); Ilya Pestov: A history of machine translation from the Cold War to deep learning. In: FreeCodeCamp (2018). A history of machine translation from the Cold War to deep learning (freecodecamp.org) (06.05.2024); Duncan Large:Post-Humane Literarische Übersetzung? Ein Kafka(esques) Beispiel: Die Qualität maschineller Übersetzung. In: Goethe-Institut Vereinigtes Königreich (2023). https://www.goethe.de/ins/gb/de/kul/lue/ail/21984887.html (06.05.2024)

AutorinText:
Ariane Siebel

Lektorat:
Jenifer Becker

Zitation
Ariane Siebel: Wie funktioniert Übersetzung mit KI? In: AI-Labkit. 2024. https://ai-labkit.de/lernen/?post=wie-funktioniert-%C3%9Cbersetzung-mit-ki

Vorheriger Beitrag
7 / 21
Nächster Beitrag