Neue Ansätze zur Lokalisierung von Video-Content

Schätzungen zufolge werden Videos im Jahr 2022 etwa 82 % des gesamten Web­daten­verkehrs bei End­kunden aus­machen. Das zeigt deutlich: Unter­nehmen, die keine Videos für Ihr Ziel­publikum er­stellen, werden schnell auf der Strecke bleiben.

Doch nur etwa 20 % der Welt­bevölkerung spricht Englisch. Deshalb müssen alle Marken, die ihren Ein­fluss global aus­bauen möchten, Videos lo­kalisieren, das heißt, den Video-Content speziell auf den je­weiligen Ziel­markt zuschneiden.

Nur wenige kennen sich mit dem Thema Video­lokalisierung so gut aus wie Andre Hemker, der neue CEO von Wordbee. Deshalb haben wir ihn in unser Globally Speaking Radio ein­geladen, seine Sicht­weise zum Thema zu erläutern.

Tiefergehende Lokalisierung

Die meisten von uns kennen her­kömmliche Video­lokalisierungs­methoden wie Unter­titelung, Synchronisation und Voiceover. Doch neue Techniken für visuellen Content – wie jene von Hemker und seinem Team – er­lauben die Pro­duktion immersiver Videos, mit denen Mar­ken mehr Kunden für weniger Geld erreichen.

Anhand eines Bei­spiels aus seiner eigenen Er­fahrung ver­deutlicht Hemker die po­tenziellen Ein­satz­möglich­keiten moderner Video­lokalisierungs- und Pro­duktions­technologie. Hemker und sein Team wur­den ge­beten, einen Werbe­film für ein Unter­nehmen zu drehen, das Navigations­software für Fahr­zeuge pro­duziert. Als Kulisse für den Film sollte ein amerikanischer Highway dienen. Doch die Voll­sperrung einer Haupt­verkehrsader in den USA war weder wirt­schaftlich noch prak­tisch umsetzbar.

Glücklicher­weise waren die Be­hörden in Polen bereit, die Pro­duktion zu unter­stützen. Das Team nutzte ein wildes Sammel­surium klassischer Medien­produktions- und Lo­kalisierungs­technik, um dem Zu­schauer zu suggerieren, dass der Werbe­spot in den USA ge­dreht worden war. „Wir haben die gesamte Szene auf einer Schnell­straße in Polen gedreht. Dazu haben wir die Be­schilderung und die Fahr­bahn­markierungen ver­ändert. Natürlich hatten wir auch Text, den wir mittels After Effects als Overlay inte­grierten. Und schließlich ver­wendeten wir auch ein Translation-Management-System.“

Ein weiteres von Hemker an­geführtes Beispiel ist ein russischer Film, den er kürz­lich ge­sehen hatte, in dem ein Schrift­zug auf einem Arm­band ge­zeigt wurde. An­statt den Text zu lo­kalisieren, was Hemker zu­folge recht ein­fach ge­wesen wäre, war der Text auf Russisch be­lassen worden. Winzige Details wie diese können in der Summe darüber ent­scheiden, ob ein Film gut oder schlecht ankommt.

Eine über den reinen Text und Bilder hinaus­gehende Lo­kalisierung er­fordert jedoch einen tief­greifenderen An­satz. „Globally Speaking“-Moderator Jim Compton be­zeichnet dies als „deep localization“, also tiefer­gehende Lokalisierung: „... die Lokalisierung geht sehr in die Tiefe, stimmt‘s? Es wird nicht nur ober­flächlich lo­kalisiert, sondern gründ­lich bis in den Kern.“ Und genau das wurde im in Polen ge­drehten Werbe­spot des Navigations­herstellers getan.

Tiefergehende Integration von Lokalisierung und Technologie

Hemker erläutert außer­dem „Hürden im Technologie­umfeld“ in der Lokalisierungs­branche, die die Skalier­barkeit und das Wachstum von Video­lokalisierung aus­bremsen. Im Interview merkt Jim Compton an: „Sowohl die Lokalisierung als auch die Audio- und Video­produktion haben eine eigene Technologie­landschaft. Sie sind von­einander ge­trennt.“ Hemker ent­gegnet: „Es gibt nicht viele, die sich in beiden Welten gut aus­kennen, und das auch noch gut genug, um beide zu kom­binieren.“ Es ist höchste Zeit, dass beide Tool­sets mit­einander integriert werden, um öfter tiefer­gehend lokalisieren zu können.

Sowohl Compton als auch Hemker können die Zu­kunft der Lokalisierungs­technologien kaum erwarten. Sie gehen davon aus, dass sie besser mit Video­produktions­software wie After Effects und Unter­titelungs­plattformen integriert sein werden, um die momentanen Hürden zu be­seitigen und Lo­kalisierungs­prozesse zu be­schleunigen, stärker zu auto­matisieren und ins­gesamt effizienter zu ge­stalten. Die Ver­knüpfung von separaten Lo­kalisierungs- und A/V-Teams würde auch dazu bei­tragen, dass beide Sei­ten die Arbeits­weise der anderen besser ver­stehen und so noch mehr innovative Ideen hervor­bringen – für eine bessere und schnellere Video­lokalisierung.

Arbeiten im Rahmen der Möglichkeiten

Besonders große Technologie-Unternehmen sind oft schnell dabei, die neuesten Tools und innovative Technologien zu über­nehmen, um der Konkurrenz einen Schritt voraus zu sein, die Gewinn­spanne zu erhöhen und mehr Umsatz zu generieren. Doch wie sollen sie neue Technologien übernehmen, wenn sie nicht wissen, dass es sie gibt? Als Beispiel für die Un­zulänglich­keiten der meisten Video­lokalisierungs-Workflows führt Hemker einen führenden Online-Streaming-Anbieter für Film und Fern­sehen an, der in 190 Ländern aktiv ist. Dennoch „findet man nur drei, vier oder fünf Synchron­versionen. Der Prozess ist so spe­zialisiert, dass man speziell aus­gebildete Leute dafür braucht, um gute Arbeit zu leisten … Man muss einen Workflow für ein ge­meinsames Experten­team er­stellen, um wirk­lich gute Synchronisationen zu er­zielen.“ Derzeit läuft der Lo­kalisierungs­prozess noch so ab: Der ge­sprochene Text eines Videos – die Audiospur – wird ex­trahiert und dann trans­kribiert. Diese Trans­kription muss dann in die vom Kun­den ge­wünschten Sprachen über­setzt werden. Im nächsten Schritt kommen die passenden Sprecher ins Studio, um die über­setzten Ver­sionen auf­zunehmen. Und zu guter Letzt müssen Audio­techniker den Pro­zess umkehren, um den neuen lo­kalisierten Text in die Videos zu in­tegrieren. Ganz zu schweigen von der Unter­titelung und der Lo­kalisierung der Elemente im Video selbst.

Doch mit der fortschreitenden Ent­wicklung der Technologie werden Unter­nehmen effektivere Work­flows zur Ver­fügung stehen, die eine Skalierung ihrer Video­lokalisierungs­vorhaben er­möglichen, die Qualität steigern sowie die Kosten senken. Das be­deutet mehr lo­kalisierte Videos, mehr End­kunden, die sie sich an­schauen können, und im Ideal­fall mehr Um­satz welt­weit. Ein zu­sätzliches Plus: Auch das Be­nutzungs­erlebnis wird auf­gewertet, wenn Kunden ihre Lieblings-TV-Sendungen oder -Filme mit ver­schiedensten Synchro­nisationen und Unter­titeln schauen können.

Doch dazu müssen die Tools auf neue Weise mit­einander ver­eint werden. Es geht darum, wie Jim Compton es aus­drückt, „die Lo­kalisierungs­tools in das eigent­liche System zu integrieren, in dem der Content erstellt wird.“

Die Zukunft der Videolokalisierung

Technologie wird bei der Hin­wendung zu Video-Content und allem darum herum eine ent­scheidende Rolle spielen. Für Hemker stehen dabei zwei Trends an vor­derster Stelle: maschinelle Über­setzung und Inter­operabilität. Zur maschinellen Über­setzung merkt er an: „Ich glaube, sobald ge­wisse Unter­nehmen er­kennen, wie dem Prozess mehr Zeit gegeben und wie er kosten­günstiger ge­staltet und op­timiert werden kann, dann wird sich einiges in diesem Be­reich tun.“ Hinter dem Be­griff Inter­operabilität steht das Konzept, dass Tools mit­einander in­tegriert werden und reibungs­los zusammen­arbeiten können. Hemker meint dazu: „Ich finde es be­stürzend, dass unsere Branche noch immer so viele ver­schiedene Technologien nutzt, die nicht mit­einander kompatibel sind.“

 

Video-Content wird für Unter­nehmen und deren Marken ein immer wichtigeres In­strument werden, um Kunden an­zusprechen und mit ihnen zu inter­agieren. Um die An­forderungen eines globalen Marktes an den be­vorzugten Typ digitalen Contents zu er­füllen, sind immer mehr Lokalisierungen not­wendig. Doch die zu­gehörigen Pro­zesse müssen noch weiter­entwickelt werden, damit Unter­nehmen diesen Content in größerem Umfang, schneller und zu ge­ringeren Kosten pro­duzieren können. Das ge­samte Inter­view mit Andre Hemker hören Sie in der 106. Folge von Globally Speaking. Wenn Sie über künftige Fol­gen auf dem Laufenden blei­ben möchten, können Sie den Podcast auch abonnieren.