Ihre Einführung in die maschinelle Übersetzung für Unternehmen

Wenn auch Ihr Unter­nehmen, wie viele andere im digitalen Zeit­alter, immer mehr und immer schneller Content er­stellen und ver­walten muss, Ihr Budget für Lo­kalisierungen aber nicht mit­wächst, dann könnte maschinelle Über­setzung (MT) eine Lösung für Sie sein.

Um Unternehmen den Ein­stieg in die MT zu er­leichtern, haben wir kürz­lich ein Webinar an­geboten, in dem Patrick Beßler, Machine Translation Engineer bei RWS Moravia, die Ge­schichte von MT sowie An­wendungs­fälle für Unter­nehmen vor­gestellt und erste Schritte er­läutert hat. Hier eine Zu­sammenfassung seiner Präsentation.

Ein Blick in die Geschichte

Bei maschineller Über­setzung, einem der ältesten Teil­bereiche von künst­licher Intelligenz (der bis in die 1950er Jahre zurück­reicht), werden Texte mit­hilfe von Soft­ware aus einer Sprache in eine andere über­setzt. Als die Technologie ein­geführt wurde, war sich die Wissen­schaft sicher, dass die an­fänglichen Pro­bleme binnen weniger Jahre be­seitigt sein dürften. 70 Jahre später ist MT jedoch ein noch immer an­dauerndes Experiment, das in den letzten Jahren zwar einige be­achtens­werte Fort­schritte und Innovationen hervor­gebracht hat, dennoch hat diese Technologie noch einen weiten Weg vor sich.

Eine der signifikantesten Än­derungen in der MT war der Wechsel von regel­basierten zu statistischen Modellen. Regel­basierte MT, bei der linguistische Regeln für die Über­setzung aus einer Sprache in eine andere auf­gestellt werden, kommt heute noch immer in manchen An­wendungen zum Einsatz. Seit den späten 1980er Jahren jedoch werden meist statistische MT-Modelle ein­gesetzt. Der größte Vor­teil war die Senkung der Kosten. Statistische MT nutzt moderne CPU-Ressourcen besser aus und er­möglicht Skalen­effekte, da derselbe Algorithmus – im Gegen­satz zu regel­basierten Modellen – für das Trainieren vieler Sprachpaare ver­wendet werden kann. Aller­dings kommen statistische Modelle hin­sichtlich der Qualität, konkret des Sprach­flusses, irgendwann an ihre Grenzen.

Eine jüngere Unter­kategorie der sta­tistischen Modelle ist die neuronale maschinelle Über­setzung (NMT), die auf den­selben Grund­konzepten beruht, jedoch die neuronalen Netze des mensch­lichen Ge­hirns nachahmt. NMT nutzt das größere Leistungs­potenzial moderner Com­puter noch besser aus und er­möglicht da­durch eine bessere lin­guistische Qualität. In NMT-Modelle können auch Deep-Learning-Techniken in­tegriert werden, um bessere und schnellere Über­setzungen im Ver­gleich zu her­kömmlichen statistischen Modellen zu er­zielen. Derzeit gelten sie als neuester Stand der Technik in Sachen MT für Unter­nehmen und werden von Tech-Giganten wie Google und Microsoft ein­gesetzt. Anzumerken ist hier jedoch, dass NMT höhere Kosten mit sich bringt. Dies ist der höheren Computer­leistung ge­schuldet, die dazu er­forderlich ist.

Welchen Unternehmensanwendungen nützt MT?

Im Allgemeinen fällt das Argument für MT in Übersetzungs­projekten mit großen Content-Volumina unter dem Gesichts­punkt des Return on Investment (ROI) am stärksten aus. Das gilt vor allem bei Content, der nützlich ist, aber nicht die Priorität hat, um die Kosten einer voll­ständigen Human-Übersetzung zu recht­fertigen. Dazu zählt beispiels­weise die Über­setzung von Kunden­feedback. Der Einsatz von MT hat auch Vor­teile, wenn es auf die Ge­schwindigkeit an­kommt, die Kosten niedrig ge­halten werden müssen oder der wachsende Über­setzungs­bedarf ein festes Budget übersteigt.

Ein weiterer Einsatz­bereich für die maschinelle Über­setzung ist die mehr­sprachige Übersetzung interner Kommunikation unter Mit­arbeitern und/oder An­wendern eine Self-Service-Lösung. Community-Foren oder die Kommunikation in inter­national tätigen Unter­nehmen sind typische Bei­spiele. Zu guter Letzt kann MT auch als Komponente in einen größeren Service-Workflow integriert werden, z. B. in einer mehr­sprachigen Sentiment­analyse oder bei der Echt­zeit­übersetzung von ge­sprochener Sprache (Speech-to-Speech Translation, kurz S2ST oder SST).

Es gibt also viele Einsatz­gebiete für MT, sogar für Marketing­texte, die früher als zu komplex galten, als dass sie auto­matisch über­setzt werden könnten. Schließlich ist Marketing­material stark auf die Marke aus­gerichtet und soll eine nuancierte Botschaft vermitteln.

Welche Vorteile bringt MT?

Der größte Vorteil von maschineller Über­setzung für Unter­nehmen ist eine höhere Pro­duktivität, wodurch sich die Markt­einführungs­zeit ver­kürzen, das Budget ein­halten und steigende Volumina besser be­wältigen lassen. Besonders in größeren, inter­national tätigen Unter­nehmen mit enormen Mengen an Content, den es zu über­setzen gilt, kann ein einziges robustes MT-System mehreren Übersetzungs­zwecken dienen – von interner Kommunikation über Blog­beiträge bis hin zu Community-Foren. Außerdem kann ein gut ein­gerichtetes MT-System Tipp­fehler oder Buchstaben­dreher ver­meiden, die das mensch­liche Auge schnell über­sieht. Zusätzlich werden die Texte all­gemein konsistenter.

Welche Faktoren sind bei der Wahl eines MT-Services zu berücksichtigen?

Qualitätsanforderungen

Maschinelle Übersetzung ist offen­sichtlich für die unter­schiedlichsten Szenarien ge­eignet und die Ziel­text­qualität kann ebenso stark variieren wie der Kontext. Die Qualität steigt dabei in direkter Proportion zur Qualität und zum Umfang der Trainings­daten, die in das System ein­fließen. Darüber hinaus haben Qualität, Einheit­lichkeit und Kom­plexität des Ausgangs­textes einen direkten Ein­fluss auf die Zieltext­qualität. So kann das Fehlen von Akronymen oder um­gangs­sprachlichen Wendungen in den Trainings­daten zu schlechteren Über­setzungs­ergebnissen führen.

Es ist wichtig, zwischen Budget- und Zeitvorgaben und der ge­wünschten Qualität und Nuancierung ab­zuwägen. Wenn es beispiels­weise nur darum geht, die Kern­aussage eines Textes zu ver­stehen, dann ist eine Über­setzung mit einer MT-Lösung wahr­scheinlich ein­facher und das ge­wünschte Qualitäts­niveau leichter zu er­reichen. Bei Texten jedoch, die auf eine starke emotionale Wirkung ab­zielen, wie bei Vertriebs- oder Marketing-Content, ist eine spe­zialisiertere Engine nötig, da es hier viel stärker auf Nuancen ankommt, die eine größere Heraus­forderung darstellen.

Sprachliche Unterschiede

Was auch be­rücksichtigt werden muss, ist der Um­stand, dass nicht alle Sprachen oder Sprach­paare gleich auf­gebaut sind. Während bei Über­setzungen zwischen Nieder­ländisch und Englisch im Allgemeinen – dank der Ähnlich­keit beider Sprachen – gute Er­gebnisse erzielt werden, sind Über­setzungen zwischen Chinesisch und Englisch viel kom­plexer aufgrund der er­heblichen Unter­schiede in der Syntax, Morphologie und Logik.

Generische oder maßgeschneiderte MT?

MT kann auf verschiedene Weise bereit­gestellt werden, je nach An­forderungen und Ein­schränkungen. So lassen sich generische Engines recht einfach und kosten­günstig bereit­stellen und nutzen. Dies hat aber natürlich Aus­wirkungen auf die er­reichbare linguistische Qualität. Die An­passung einer Engine an einen spezifischen Einsatz­bereich führt zwar zu besseren Er­gebnissen, ist je nach Sprache und Content jedoch mit ent­sprechenden Kosten verbunden. Oft fallen die Kosten für das Customizing nur an­fangs an und nicht fort­laufend. Wie bereits erwähnt, eignet sich eine maßgeschneiderte MT unter dem Gesichts­punkt des ROI am ehesten bei großen Content-Volumina.

MT-Post-Editing

Die MT-Ausgabe kann mit Post-Editing nach­bearbeitet werden. Hier prüfen Post-Editoren, beispiels­weise ent­sprechend ge­schulte Über­setzer oder Lektoren, die maschinellen Über­setzungen. Je nach den An­forderungen an das Er­gebnis kann Post-Editing in ver­schiedenen Qualitäts­stufen durch­geführt werden. Post-Editing ist besonders hilf­reich, um Terminologie zu finden, die die MT-Engine möglicher­weise nicht er­kannt oder falsch aus­gegeben hat. Dies kann der Post-Editor dann korrigieren. Die Engine kann zudem neu trainiert werden, um in Zukunft die richtigen Be­nennungen aus­zugeben und so den Post-Editing-Aufwand zu re­duzieren. Je nach Qualitäts­anforderungen und dem ent­sprechenden Maß an Post-Editing im Work­flow kann diese Phase na­türlich unter­schiedlich viel Zeit und Geld in Anspruch nehmen.

Informationssicherheit

Schließlich ist noch zu erwähnen, dass nicht alle MT-Anbieter dasselbe Maß an Informations­sicherheit für die in den MT-Engines ver­arbeiteten Daten bieten. Kosten­lose MT-Services wie Google Translate beispiels­weise speichern und nutzen die hoch­geladenen Daten, um ihre Engines zu trainieren. Einer der Vor­teile von be­zahlten MT-Services ist des­halb, dass Sicherheits­anforderungen bereits während der Ein­gangs­analyse ge­klärt und mit dem An­bieter von maschinellen Über­setzungen direkt ver­einbart werden können.

Wie erfolgt die MT-Bereitstellung?

Zwar kommt es immer auf die individuellen An­forderungen an, doch im All­gemeinen um­fasst die MT-Bereit­stellung folgende Phasen:

1. Eingangsanalyse

Dieser erste Schritt dient der Analyse der bereits be­stehenden Pro­zesse, der Fest­legung von Zielen, (z. B. welche Sprachen oder Content-Typen über­setzt werden sollen) und dem Auf­stellen von Qualitäts­anforderungen.

2. Pilotprojekt

In dieser Phase wird eine ge­eignete Engine auf Basis der Analyse­ergebnisse aus­gewählt und, im Falle einer maß­geschneiderten Engine, beginnt das Engine-Training.

3. Test

Die gewählte Engine wird entweder mittels auto­matischer oder manueller Über­prüfungen ge­testet und evaluiert, gegebenen­falls auch durch beides. Während der Test­phase soll er­mittelt werden, ob die Qualitäts­ziele er­füllt werden oder ob die Er­gebnisse weiter optimiert werden müssen.

4. Engine-Optimierung

Falls die Test­phase ergibt, dass die Aus­gabe ver­bessert werden muss, kann die MT-Engine mit zusätz­lichen Daten ge­füllt und weiter trainiert werden.

5. MT-Bereitstellung

In dieser Phase wird die MT-Engine in den Work­flow integriert, ent­weder durch Ver­knüpfung mit CAT-Tools (computer­unterstützte Über­setzung) oder Translation-Management-Systemen (TMS) oder aber als eigenständige Anwendung.

6. Wartung

Die MT-Engine wird überwacht und im Laufe der Zeit durch immer neuen Content weiter trainiert. Dies ist be­sonders wichtig, wenn neue Pro­dukte oder Services ein­geführt werden, ein Re­branding erfolgen soll oder ein Unter­nehmen seinen Kommunikations­stil ändern möchte.

Fazit: Eine erfolgreiche MT-Bereit­stellung er­fordert sorg­fältiges Vorgehen

Wie Sie sehen, sind bei der Kon­zeptionierung und Bereit­stellung eines MT-Systems viele Faktoren zu be­rücksichtigen. Welche Sprachen und welcher Content sollen über­setzt werden? Welche Qualitäts­anforderungen werden ge­stellt? Wie groß ist das Budget und der vor­gegebene Zeit­rahmen? All diese Faktoren sind bei der Wahl der am besten ge­eigneten Lösung zu be­rücksichtigen. Deshalb em­pfiehlt es sich immer, einen pro­fessionellen Lokalisierungs­anbieter ein­zubeziehen, der mit MT-Lösungen bestens vertraut ist. Dort werden Ihre An­forderungen analysiert und Ihre Kosten-, Zeit- und Qualitäts­vorgaben be­rücksichtigt, damit die bereit­gestellte MT-Lösung die von Ihnen ge­wünschten Er­gebnisse erzielt.

Wir bei RWS Moravia sind führend in diesem Be­reich. Wir ar­beiten eng mit Unter­nehmen zu­sammen, um ihre individuellen Ziele zu er­mitteln und die dazu passende MT-Technologie zu implementieren.

 

Sind Sie neugierig geworden? Wenn Sie mehr über dieses Thema er­fahren möchten, können Sie sich das gesamte Webinar anhören.