Stellen Sie sich vor, Sie übersetzen eine Geschichte über einen Hund. Dafür verwenden Sie ein Translation-Management-System, und der Ausgangssatz lautet wie folgt: „Der schwarze Hund wurde fast überfahren, als er über die Straße lief.“ Nehmen wir nun an, dass es im Translation Memory (TM) bereits eine Übersetzung für folgenden Satz gibt: „Der braune Hund wurde überfahren, als er über die Straße lief.“ Diese Beinahe-Übereinstimmung wird als „Fuzzy Match“ bezeichnet. Alles, was hier noch getan werden muss, ist, „braun“ durch „schwarz“ zu ersetzen und das kleine, aber eminent wichtige Wörtchen „fast“ hinzuzufügen.
Die Engine einer maschinellen Übersetzung (MT) bietet Ihnen jedoch eine – abgesehen von der nicht ganz geglückten Wortwahl – perfekt passende Übersetzung an, nämlich: „Als der schwarze Hund über die Straße lief, wurde er fast getroffen.“
Würden Sie die Übersetzung aus dem TM verwenden, die von einem Menschen stammt, aber bearbeitet werden müsste, oder die nahezu perfekte, allerdings MT-generierte Übersetzung?
Auf den ersten Blick mag die eine Lösung so gut sein wie die andere, doch tatsächlich ist die Entscheidung gar nicht so einfach. Dabei war die Wahl zwischen TM und MT früher einmal durchaus einfach: Man ging einfach den Weg des geringsten Aufwands. Das war in der Regel die Übernahme des TM-Eintrags, da die MT minderwertige Ergebnisse lieferte. Heute haben Übersetzer nicht selten die Qual der Wahl. Dank der Fortschritte im Bereich des maschinellen Lernens ist nun endlich der Punkt erreicht, an dem MT-generierte Übersetzungen mit Fuzzy Matches mit geringer Übereinstimmung konkurrieren können.
Heißt das, dass TMs nun zum alten Eisen gehören?
Keineswegs. Oder zumindest noch nicht. Allerdings ist es sehr wohl an der Zeit, die seit zwei Jahrzehnten bewährten Branchenstandards für Fuzzy Matches zu hinterfragen.
Die Qual der Wahl für den Übersetzer: Fuzzy Match oder MT-Ausgabe?
Früher galt die Faustregel: Fuzzy Matches mit weniger als 70 bis 75 % Übereinstimmung sind nicht mehr zu gebrauchen. Und bis vor Kurzem gab es auch wenig Grund, diese Regel zu hinterfragen, denn ein Fuzzy Match dieser Kategorie schlug die MT-Ausgabe um Längen. Dann setzte die MT zum großen Sprung an – neuronale MT-Systeme kamen auf. Und selbst jetzt, wo sich die Ergebnisse der MT allgemein verbessert haben, haben wir noch keine akademische Arbeit oder große Forschungsarbeiten in einer der Hauptsprachen gesehen, die beweisen, dass MT an TM vorbeigezogen wäre.
Dabei gibt es durchaus sporadische Hinweise, wonach dieser Punkt bereits erreicht sein könnte. Anfang 2019 veröffentlichte TAUS einen Bericht mit eigenen Daten, aus denen hervorgeht, dass die maschinelle Übersetzung für Matches unterhalb der 85-%-Schwelle bessere Ergebnisse liefert als aus TMs – zumindest in romanischen Sprachen.
Wäre es da nicht logisch, die Untergrenze für brauchbare Matches auf mindestens 85 % anzuheben? Nun, ganz so einfach ist es nicht:
- Sprache ist so flexibel und die mögliche Variantenvielfalt je nach Sprache und Content-Typ so unüberschaubar groß, dass niemand mit Sicherheit sagen kann, dass 85 % in jedem denkbaren Anwendungsfall ein geeigneter Grenzwert wären. Für französische Rechtstexte gelten andere Standards als für technischen Content in russischer Sprache, um nur zwei beliebige Beispiele zu nennen.
- Darüber hinaus gibt es weitere Variablen: Nicht jede MT-Engine ist für jeden Anwendungszweck gleich gut geeignet, und je nachdem, welchen Algorithmus das TM-System verwendet, variiert das Resultat – den einen „Standard“-Algorithmus gibt es nämlich nicht. Auch hier existieren praktisch unendlich viele Möglichkeiten.
- Selbst wenn sich sicher sagen ließe, dass Fuzzy Matches mit mindestens 85 % Übereinstimmung ausnahmslos immer besser abschneiden als die MT, heißt das im Umkehrschluss noch lange nicht, dass die MT unterhalb dieser Schwelle stets die bessere Wahl ist. Eine magische Formel, die sich für alle Eventualitäten anwenden ließe, existiert schlicht nicht.
Angesichts dieser Umstände bleibt nur das Experimentieren in der Praxis. Bei Fuzzy Matches mit einer relativ geringen Übereinstimmung um die 70 % stehen Übersetzer nun vor der schwierigen Entscheidung, ob es sich lohnt, den Fuzzy Match zu übernehmen, oder ob eine MT-generierte Übersetzung der vollen Originalaussage hilfreicher ist. Der Bearbeitung bedürfen voraussichtlich beide, wenn auch in verschiedener Hinsicht: Während der Fuzzy Match so angepasst werden muss, dass er die Originalaussage voll wiedergibt, weist die MT-Ausgabe womöglich Defizite hinsichtlich Genauigkeit und/oder Sprachfluss auf.
Die Frage, welches Vorgehen zeitsparender ist, lässt sich nicht eindeutig beantworten.
Doch die Tatsache, dass sich diese Frage heute überhaupt stellt, deutet auf eine neue, richtungweisende Entwicklung in der Übersetzungsbranche hin. Eine Entwicklung, die in gewisser Weise an das Zeitalter der Industrialisierung erinnert. Die Gebrüder Wright beispielsweise scheiterten mit Dutzenden Prototypen ihrer Flugapparate, ehe sie sich endlich in die Lüfte schwingen konnten. Auf ähnliche Weise müssen auch wir heute Neues ausprobieren, aus Fehlern lernen und mit zunehmender Erfahrung (und immer besserer MT) eine Lösung finden, denn es ist schlicht unmöglich, jede einzelne Satzbauvariante oder Variable von vornherein zu berücksichtigen.
Der Kipppunkt
Doch wenn nicht jede Möglichkeit berücksichtigt werden kann, woher wissen wir dann, wann die MT das TM in puncto Zuverlässigkeit überholt hat?
Der Wandel wird schrittweise erfolgen, vorerst lautet die Frage jedoch, wie sich „Qualität“ definieren lässt.
Derzeit liegt es noch ganz und gar im Auge des Betrachters, ob die Qualität einer maschinellen Übersetzung (mit oder ohne Post-Editing) gegenüber einem 85-%-Match (mit oder ohne Revision durch den Übersetzer) als besser oder schlechter eingestuft wird. Aber eines Tages wird die Technologie selbst in der Lage sein, uns auch in dieser Frage zu leiten.
Damit nähern wir uns dem Thema der Qualitätsbewertung. Neuronale MT kann die Qualität der MT-Ausgabe bereits selbst evaluieren. Sie liefert nicht bloß eine maschinell generierte Übersetzung, die der Übersetzer dann übernimmt oder verwirft, sondern bietet zunehmend intelligentere Hinweise, etwa dass eine Übersetzung nicht ideal ist, wo mögliche Fehlerquellen liegen und welche Optionen es zu deren Beseitigung gibt. Neuronale MT unterzieht ihre Ergebnisse nicht nur einer Selbstbewertung, sondern einer Selbstdiagnose. Mit der Zeit lernt sie immer mehr dazu, bis sie in der Lage ist, Fehler basierend auf früheren Entscheidungen des Übersetzers selbstständig zu korrigieren. Bis zu einem gewissen Grad ist dies bei adaptiver MT schon jetzt der Fall.
Sobald die MT ihre Fehler ganz allein erkennen und dem menschlichen Editor wertvolle Hinweise zur Fehlerbehebung liefern kann, wird sie die TM-Technologie in bestimmten Anwendungsfällen überflügeln. Und dabei sprechen wir keineswegs von der fernen Zukunft. Angesichts der massiven Investitionen führender Technologieunternehmen könnte die MT diesen Kipppunkt früher erreichen als gedacht.
Eines sei jedoch klargestellt: Dies bedeutet nach wie vor und mit hoher Wahrscheinlichkeit nicht, dass Menschen durch Maschinen ersetzt werden. Vielmehr werden wir den Übergang von der bisherigen computerunterstützten Übersetzung zur personenunterstützten Übersetzung erleben. Der Computer wird künftig einen ersten Vorschlag bereitstellen – zumindest für Content mit geringerem emotionalem Gehalt, irgendwann aber vielleicht auch für anspruchsvolleren Content – und der Mensch bessert dann nach. Abschließend wird die Leistung der MT-Engine beurteilt.
Damit stellt sich natürlich die Frage, was dieser Wandel für die Übersetzer in petto hat. Wenn am Anfang des Übersetzungsprozesses ein computergenerierter Vorschlag steht, wandelt sich die Rolle des Übersetzers eher hin zum Editor. Bedeutet dies weniger Arbeit und damit finanzielle Einbußen für Übersetzer? Was ist mit hoch spezialisierten Übersetzern, die stark markenspezifischen Content bearbeiten? Für sie sind die MT und das TM nichts weiter als lästiges Beiwerk, das den kreativen Übersetzungsprozess eher behindert. Können wir diesen Übersetzern MT aufzwingen?
Letztlich führt alles zu dem Grund zurück, aus dem wir bisher eher den Fuzzy Matches vertrauen: dem menschlichen Touch. Doch wenn die MT eines Tages feinere Nuancen und Konnotationen der Sprache verstehen, den Satzfluss richtig nachvollziehen und sprachübergreifend verschiedene Schreibstile erkennen kann, wer weiß, wohin der Weg uns dann führt?
Wie ist Ihre Meinung dazu? Sollten aus Rücksicht auf die immer bessere MT-Qualität nur noch TM-Einträge mit höherer Wertigkeit berücksichtigt werden? Gern können Sie im Kommentarfeld unten fachsimpeln oder sich direkt an uns wenden.
Wir bedanken uns bei Jon Ritzdorf, Solution Architect bei RWS Moravia sowie Professor am Middlebury Institute of International Studies (MIIS) und an der Universität Maryland (UMD), für seinen Beitrag zu diesem Blogartikel.