Na­he Zu­kunft

Sze­nen aus Science-Fiction-Fil­men, in de­nen wir uns mit­hil­fe von Com­pu­tern mit Men­schen frem­der Mut­ter­spra­chen pro­blem­los mit­ein­an­der un­ter­hal­ten kön­nen, ken­nen wir wohl al­le.

Der Fachhandler - - Thema - Tho­mas Rieg­ler

Was nach pu­rer Zu­kunfts­mu­sik klingt, ist uns in der Tat be­reits nä­her, als wir glau­ben möch­ten. Fin­di­ge Pro­gram­mie­rer ar­bei­ten be­reits in­ten­siv am Er­rei­chen die­ses fu­tu­ris­ti­schen Ziels.

Au­dio Tran­skrip­ti­on

Bei der Au­dio Tran­skrip­ti­on er­kennt ei­ne Soft­ware das ge­spro­che­ne Wort, et­wa in Ra­dio­sen­dun­gen und im Fernsehen, und wan­delt es als Text um. Das ist nichts Neu­es. PC-Pro­gram­me und Apps sind be­reits für je­der­mann ver­füg­bar. Wäh­rend die Au­dio Tran­skrip­ti­on für Eng­lisch be­reits recht gut funk­tio­niert, zeig­te sie in Deutsch bis­lang noch er­heb­li­che Män­gel. Ih­re Tref­fer­quo­te lag nur bei rund 85 Pro­zent. Mit ak­tu­el­len Ent­wick­lun­gen konn­te man die Ge­nau­ig­keit je­doch be­reits an die

98,5 Pro­zent stei­gern. Wie uns Soft­ware­Ent­wick­ler auf den Me­dien­ta­gen München er­läu­ter­ten, wird die Tref­fer­ge­nau­ig­keit je­doch stark von der Aus­spra­che be­stimmt. Ge­schul­te Nach­rich­ten­spre­cher, wie et­wa je­ne des Deutsch­land­ra­di­os, sor­gen der­zeit noch für ei­ne un­gleich hö­he­re Tref­fer­ge­nau­ig­keit als et­wa Vor­trä­ge im Dia­lekt.

Si­mul­tan­über­set­zung

Die aus ei­nem Au­dio ge­won­ne­nen Tex­te kön­nen qua­si in Echt­zeit be­reits in 30 Spra­chen über­setzt wer­den. Wo­mit man et­wa ei­nen Ra­dio­text mit ei­ner Ver­zö­ge­rung von nur we­ni­gen Se­kun­den ne­ben Deutsch auch in ei­ner von 30 Fremd­spra­chen als Text vor­lie­gen ha­ben kann. Wo­bei so­gar Über­set­zun­gen in Rus­sisch oder Chi­ne­sisch mög­lich sind. Wo­bei die Ge­nau­ig­keit der Über­set­zun­gen bei et­wa 85 Pro­zent liegt. All das ist kei­ne Zu­kunfts­mu­sik mehr.

Der­zeit ar­bei­ten klu­ge Köp­fe in­ten­siv dar­an, die­se Funk­tio­nen so­weit zu ver­bes­sern, dass die­se soft­ware­ge­ne­rier­ten Tex­te höchs­ten An­sprü­chen ge­nü­gen. Künf­tig sol­len die­se Pro­gram­me nicht nur mit Schrift­spra­che gut klar kom­men, son­dern auch Dia­lek­te ver­ste­hen und kor­rekt ver­ar­bei­ten kön­nen. Si­mul­tan­über­set­zun­gen bie­ten sich auch für das Fernsehen an. Be­reits in et­wa fünf Jah­ren könn­te man so­weit sein, dass aus­län­di­sche Fern­seh­pro­gram­me per Soft­ware qua­si li­ve mit deut­schen Un­ter­ti­teln ver­se­hen wer­den könn­ten. Da­mit könn­ten wir zum Bei­spiel rus­si­sche, spa­ni­sche oder ara­bi­sche Sta­tio­nen mit selbst ge­ne­rier­ten deut­schen Un­ter­ti­teln an­se­hen.

Laut Aus­kunft ei­nes Pro­gram­mie­rers ist die­se Auf­ga­be je­doch un­gleich schwie­ri­ger zu lö­sen, als bei ei­ner rei­nen Au­di­oAn­wen­dung. So stellt Fernsehen un­gleich hö­he­re An­for­de­run­gen an ei­ne Tran­skrip­ti­ons­und Über­set­zungs­soft­ware. Ab­ge­se­hen von Nach­rich­ten, wird im Fernsehen sel­ten wirk­lich schön und klar ver­ständ­lich ge­spro­chen. Al­lei­ne die der Dra­ma­tur­gie ei­ner Sen­dung fol­gen­den Sprach­me­lo­die er­for­dert ein fle­xi­ble­res er­ken­nen der ge­spro­che­nen Tex­te. Wei­ter ist im TV Dia­lekt häu­fi­ger Gast. Al­lei­ne im deut­schen TV gibt es ge­nü­gend Sen­dun­gen mit baye­ri­schem oder ös­ter­rei­chi­schem Dia­lekt. Von ver­gleich­ba­rem dürf­ten wir auch bei an­de­ren Sprach­re­gio­nen aus­ge­hen. Wäh­rend bei Au­dio-Tran­skrip­tio­nen und -Über­set­zun­gen Zeit­ver­zö­ge­run­gen

von et­wa fünf Se­kun­den oh­ne wei­te­res pro­blem­los to­le­rier­bar sind, er­for­dert TV ei­ne weit­aus schnel­le­re Re­ak­ti­ons­zeit. So soll­ten Über­set­zun­gen dann im Bild ein­ge­blen­det wer­den, wäh­rend die be­tref­fen­de Per­son noch spricht. Al­lei­ne we­gen der schnel­len Schnitt­fol­ge vie­ler TV-Pro­duk­tio­nen wür­de der Text bei ei­nem Zeit­ver­satz von we­ni­gen Se­kun­den hoff­nungs­los den ge­zeig­ten Bild­in­hal­ten nach­hin­ken.

Com­pu­ter lernt mei­ne Stim­me

In ei­nem wei­te­ren Pro­jekt ist man gera­de da­bei, dem Rech­ner die Stim­me des Nut­zers zu ver­lei­hen. Von ver­schie­de­nen An­wen­dun­gen, wie et­wa den Ver­kehrs­nach­rich­ten-Ka­nä­len des Baye­ri­schen Rund­funks oder des WDR ken­nen wir be­reits PC-Stim­men, die ein­ge­ge­be­ne Tex­te akus­tisch wie­der­ge­ben. In Zu­kunft sol­len die­se PC-Stim­men un­se­rer ei­ge­nen Stim­me nicht nur zum Ver­wech­seln ähn­lich klin­gen. Sie sol­len auch un­se­re sprach­li­chen Ei­gen­hei­ten zu imi­tie­ren in der La­ge sein. Wie et­wa be­stimm­te Flos­keln, die wir ger­ne ver­wen­den, oder das ty­pi­sche „Äh“, wenn man gera­de im Re­de­fluss stockt. Selbst­ver­ständ­lich soll sich der Com­pu­ter auch un­se­re Sprach­me­lo­die zu­ei­gen ma­chen. Im ers­ten Schritt wird der Rech­ner mit un­se­rer Spra­che ge­füt­tert. Da­zu ge­nügt es, ei­nen vor­ge­ge­be­nen, rund zehn Mi­nu­ten lan­gen Text vor­zu­le­sen. Wei­ter kann auch frei­es Spre­chen her­an­ge­zo­gen wer­den. Die­ses eig­net sich be­son­ders, um dem Rech­ner in­di­vi­du­el­le Ei­gen­hei­ten, wie stän­dig wie­der­keh­ren­de Phra­sen, bei­zu­brin­gen. Kommt es wirk­lich so, wie es sich fin­di­ge Pro­gram­mie­rer vor­stel­len, soll­te es et­wa über Te­le­fon, für un­se­re Mit­men­schen nicht mehr oh­ne wei­te­res mög­lich sein zu er­ken­nen, ob sie mit uns selbst oder nur mit un­se­rem Com­pu­ter spre­chen. Die künf­ti­ge Com­pu­ter­stim­me soll nicht nur so klin­gen wie wir, son­dern auch auf kor­rek­te Be­to­nun­gen ach­ten. Auch Emo­tio­nen, wie et­wa hin­ter­grün­di­ger Hu­mor, Freu­de oder Wut, sol­len ver­mit­telt wer­den. Die­se be­reits greif­ba­re Zu­kunfts­vi­si­on wei­ter ge­dacht, könn­ten so­gar Spiel­fil­me und TV-Se­ri­en künf­tig von Com­pu­ter­pro­gram­men syn­chro­ni­siert wer­den. Wo­mit Syn­chron­spre­cher ei­nes Ta­ges über­flüs­sig wer­den könn­ten.

Da­mit wür­den sich uns neue Wel­ten er­schlie­ßen, oh­ne Fremd­spra­chen ler­nen zu müs­sen. Was be­son­ders für Sat-DXer span­nend wä­re

Hier wer­den die Ra­dio­nach­rich­ten in Text um­ge­wan­delt. Feh­ler der au­to­ma­ti­schen Tran­skrip­ti­on las­sen sich ma­nu­ell aus­bes­sern

Be­reits in et­wa fünf Jah­ren könn­te die Über­set­zung aus­län­di­scher TVPro­gram­me in Echt­zeit zu un­se­rem All­tag ge­hö­ren

Die Gra­fik zeigt die Grund­prin­zi­pi­en ei­ner Au­dio-Tran­skrip­ti­on. Da­bei wird das ge­spro­che­ne Wort in qua­si Echt­zeit in Text um­ge­wan­delt

Newspapers in German

Newspapers from Germany

© PressReader. All rights reserved.