Mezinárodní projekt TC-STAR (Technology and Corpora for Speech to Speech Translation), který byl koncem března zakončen v německých Cáchách (Aachen), byl věnován otázkám elektronického tlumočení mluveného slova.
TC-STAR byl zaměřen výhradně na překlad a tlumočení ve vzájemných kombinacích anglického, španělského a čínského jazyka. Bez omezení mělo být na druhou stranu možné odborné zaměření překládaných a tlumočených informací. Systém se kupříkladu testoval na debatách Evropského parlamentu s velmi širokým záběrem probíraných témat.
Technologie elektronického simultánního tlumočníka – kroky
1. Rozpoznávání řeči a převod do písemné podoby
2. Strojový překlad
3. Hlasový výstup překladu
Na cestě k elektronickému tlumočníkovi je již docela dobře zvládnuta první a třetí etapa: diktovací software nebo hlasové ovládání telebankingu se s akceptovatelnými výsledky začíná rozšiřovat v praxi. Ani hlasová syntéza dnes nečiní při praktickém nasazení žádné podstatné problémy.
Zdaleka nejdelší cestu mají vědci před sebou ještě v oblasti strojového překladu. Pojetí TC-STAR se přitom liší od dosavadního přístupu, kdy se do překladového systému naprogramovala gramatická a syntaktická pravidla, podle kterých pak software více či méně úspěšně pracoval. Zde se systém nejprve „nakrmí“ daty originálních a přeložených dokumentů a pracuje dále s těmito paralelními textovými korpusy na základě výpočtů pravděpodobnosti. Výhodou tohoto statistického přístupu je, že počítač neustále samostatně zdokonaluje svůj překladový styl.
Výsledky strojového překladu zatím nejsou příliš omračující. Závisí silně na jazykové kombinaci a komplexitě textu. Chybová kvóta ve výši 15 % je již považována za uspokojující. To přinejmenším postačuje pro hrubé porozumění obsahu, ale kvalifikovaného tlumočníka ještě v dohledné době nenahradí.
Na tříletém projektu spolupracovalo 12 partnerů ze států EU, USA, Japonska a Číny.