Neuigkeiten in der Lokalisierungstechnologie

Während sich die Lokalisierungs­branche an globale Heraus­forderungen und Ver­änderungen durch die COVID-19-Pandemie anpasst, schreitet die Ent­wicklung spannender neuer Technologien voran und auch wichtige Forschung wird weiter­hin be­trieben. Im Folgenden geben wir Ihnen einen kurzen Über­blick über wichtige aktuelle Entwicklungen.

Amazon DeepSubQE: Aufbau einer Qualitätsschätzung für Untertitel

Zwei Forscher von Amazon Prime Video haben ein neues System zur Ein­schätzung der Qualität maschinell über­setzter Unter­titel ent­wickelt und analysiert. Die Unter­suchung mit dem Titel „DeepSubQE: Quality estimation for subtitle translations“ wurde am 22. April 2020 veröffentlicht. Untersuchungs­gegenstand waren Methoden zur Ver­besserung der linguistischen Qualität mittels Qualitäts­einschätzung. Die Übersetzungs­qualität zu steigern, um inter­nationale Zuschauer zu begeistern, ist ein wesent­licher Bestand­teil der Wachstums­modelle von führenden Streaming­diensten wie Amazon Prime und Netflix. Die Forscher über­setzten etwa 30.000 Video­untertitel-Dateien aus dem Englischen ins Französische, Deutsche, Italienische, Portugiesische und Spanische.

Die Qualitätseinschätzung, laut Definition eine „Machine-Learning-Technologie, die der MT-Ausgabe auto­matisch eine Qualitäts- oder Risiko­schätzung zuweist, ohne dabei auf manuelle Vergleichs­übersetzungen zurück­zugreifen“, zeigt Heraus­forderungen in der Über­setzung auf. Vorrangig haben diese ihren Ur­sprung in der Tatsache, dass ein Satz immer auf mehr als eine Weise übersetzt werden kann.

Die Ergebnisse waren ermutigend. Die Unter­suchung zeigte, dass das DeepSubQE-Modell in mehr als 91 % der Fälle richtig lag. Bei längeren Sätzen lag die Erfolgs­quote sogar noch höher. Der zu­künftige Erfolg wird von einer Steigerung des System-Workloads und der Anzahl der Ausgabe­sprachen abhängen.

ESPnet-ST: Verbesserung von Speech-To-Speech-Übersetzungssystemen

ESPnet-ST ist ein quell­offenes Software-Toolkit, das Ent­wicklern beim „schnellen Aufbau von Speech-To-Speech-Übersetzungs­systemen innerhalb eines einzigen Frameworks“ dienen soll. Die Software erfuhr viel Beachtung auf Github, einem Software-Repository für Ent­wickler, die dort Code offen­legen, um ge­meinsam an der Ver­besserung von Software­systemen zu arbeiten.

Ein „Toolkit“ ist eine Software-Bibliothek aus Code-„Schnipseln“ (Snippets), die Entwickler in eigenen Programmen nutzen können. Ursprünglich ent­hielt ESPnet-ST Code für die auto­matische Sprach­erkennung (Automatic Speech Recognition, ASR) und Text-To-Speech (TTS), mittler­weile umfasst die Software aber auch Code für den Aufbau von MT-Systemen. Somit handelt es sich um das erste Toolkit „mit ASR-, MT-, TTS- und ST-Programmen und -Modellen in ein und derselben Codebasis“. Zur Erläuterung: MT und ST stehen für „Machine Translation“ und „Speech Translation“, also maschinelle Übersetzung bzw. Sprach­übersetzung. Die Forscher und Ent­wickler sind zu­versichtlich, dass ESPnet-ST anderen dabei helfen kann, eine weitere Hürde in der verbalen Kommunikation zu nehmen.

KantanSkynet-App für Zendesk: Sprachwechsel im Kundenservice

Unternehmen mit starker Marken­botschaft setzen immer stärker auf die Schaffung nach­haltiger Kunden­erlebnisse im Kunden­support. Immer wieder be­legen Unter­suchungen die ver­heerenden wirt­schaftlichen Konsequenzen eines mangel­haften Kunden­services: Ein Bericht spricht gar von rund 41 Milliarden US-Dollar Verlust pro Jahr alleine bei US-Unternehmen, deren Kunden­service einen schlechten Ein­druck hinter­lassen hat.

Mehr und mehr Unter­nehmen setzen auf technische Lösungen wie Chatbots, um schnelle Unter­stützung leisten zu können. Es ist un­verzichtbar für die nahtlose Kommunikation in unserer globalisierten Wirtschaft, schnell zwischen den Sprachen wechseln zu können. Genau das ist der Zweck von KantanSkynet, einer neuen App für die beliebte Support-, Vertriebs- und Kundenservice-Plattform Zendesk.

Über diese App können Serviceteams mit Kunden in deren Mutter­sprachen kommunizieren. Die Antwort des Kunden­service-Mitarbeiters wird maschinell in die Sprache des Kunden über­setzt und dann von einem Zendesk-Editor nach­bearbeitet. Der Kunde sieht nur die über­setzte Version der Antwort. Auf dieselbe Weise werden An­fragen und Ant­worten der Kunden für die Kunden­service-Mitarbeiter übersetzt.

AnyCount 4D: Mengen­ermittlung für rentablere Übersetzungen

AnyCount 4D ist ein neues Tool zur Mengen­ermittlung, das Über­setzern durch genauere Zählung dabei helfen soll, rentabler zu arbeiten. Es handelt sich um ein eigen­ständiges Programm, das mit vielen ver­schiedenen Dateitypen kompatibel ist, darunter PDFs, Textdateien, Bilder und Untertitel.

Laut den Entwicklern ist die Wort­zählung in gängigen Pro­grammen wie Word oder Excel nicht präzise genug. Oft werden Wörter und Zeichen nicht komplett be­rücksichtigt. Das kostet Übersetzer bares Geld Das Tool kann im Monats-, Quartals- oder Jahres­abonnement genutzt werden.

Streaming und Neuübersetzung: Verbesserung von Online-Meetings

Das Coronavirus hat die Art von Meetings radikal verändert – zumindest bis auf Weiteres. Platt­formen für virtuelle Meetings wie Teams, Zoom, LogMeIn und Google Meet sind be­liebt wie nie. Die ver­stärkte Konkurrenz in diesem Markt bringt es mit sich, dass die Implementierung neuer Funktionen Vor­teile verschafft.

Zu den Funktionen, an deren Ein­führung die An­bieter derzeit ar­beiten, zählen die maschinelle Übersetzung und auto­matische Transkription. Ziel ist es, das Erlebnis der inter­nationalen Meeting-Teilnehmer zu ver­bessern. Eine vor Kurzem von Google ver­öffentlichte Unter­suchung mit dem Titel „Re-translation versus Streaming for Simultaneous Translation“ be­schäftigt sich mit der Methode der Neu­übersetzung bzw. des Streamings im Bereich der Simultanübersetzung.

Die Streaming-Übersetzung ist bisher die am häufigsten angewendete Methode. Ihr größter Nach­teil ist aller­dings die Tatsache, dass der über­setzte Text während der Anzeige un­veränderlich ist (ähnlich wie Untertitel). Die andere Methode, Neu­übersetzung, birgt die Möglichkeit, Text auch während der Aus­strahlung zu ändern.

Die Forscher analysierten die Sprach­paare Deutsch > Englisch und Englisch > Französisch, um heraus­zufinden, welche Methode sich durch höhere Qualität und geringere Latenz auszeichnet. Die Latenz, also die Ver­zögerung zwischen dem ge­sprochenen und über­setzten Content, ist ent­scheidend für das Benutzungs­erlebnis. Die Unter­suchung ergab Vor­teile der Neu­übersetzung in beiden Kategorien.

Die Neuübersetzung bot bessere Qualität, weil sie „durch die Wieder­holung und Ver­besserung von Über­setzungen ein ‚hoch­wertiges End­produkt‘ zustande bringt“. Die geringere Latenz wird begründet, „weil ‚stets eine Übersetzung des gesamten Ausgangs­präfixes versucht wird‘“. Forscher fanden ebenfalls heraus, dass die Neu­übersetzung „genauso gut oder besser als hoch­moderne Streaming-Systeme“ an­genommen wurde, wenn die Anzahl der Änderungen durch Neu­übersetzungen beschränkt wurde

Wir sind gespannt, wie Anbieter von Services für virtuelle Meetings in den kommenden Monaten neue Übersetzungs­funktionen implementieren werden. Schließlich sind das Home­office und Remote Working auch nach der COVID-19-Pandemie nicht mehr wegzudenken.

 

Die Welt passt sich den Umständen an und der Ruf nach effizienten Übersetzungs­technologien wird immer lauter. Darüber hinaus hat die COVID-19-Pandemie grund­legende gesell­schaftliche Ver­änderungen angestoßen, die nach neuen Technologien verlangen. Immer mehr Menschen arbeiten von daheim oder unter­wegs und konsumieren Content über ihre be­vorzugten Streaming­dienste. Die neuesten Entwicklungen in der Übersetzungs­technologie stehen allem An­schein nach bereit, um die damit einher­gehenden An­forderungen zu erfüllen.