Překladatelské technologie pro EU

Generální ředitelství pro překlady (DGT) Evropské unie je největší překladatelskou službou na světě. Pro DGT pracuje kolem 1 800 pracovníků, což je 8 % celkového personálu EU. V roce 2003 – ještě před rozšířením – bylo přeloženo 1,4 mil. stran textu ve 110 možných jazykových kombinacích. Po rozšíření, kdy se rozšířil počet úředních jazyků z 11 na 20, se počet jazykových kombinací rozrostl na 380.

Evropská unie


Pro zvládnutí takové masy se v některých případech pro hrubé porozumění textu používá strojového překladu. Od roku 1976, v souvislosti s přijetím Dánska, Irska a Velké Británie, vlastní Evropská unie licenci na automatizovaný překladový systém Systran. Ten se dnes používá pro 26 jazykových párů, a slouží jako meziprodukt pro další zpracování člověkem.

Jak pracuje Systran? Jedná se o systém založený na abstrakci gramatických pravidel, který probíhá ve 4 krocích:

1. Příprava výchozího textu (preprocessing)
Provede se formátování v jednotném formátu, vyhledají se frekventovaná slova.
2. Analýza
Dokument se rozčlení na dílčí věty, ve kterých se vyhledá podmět a přísudek.
3. Transfer do cílového jazyka
Slova nebo skupiny slov se vyhledají v interních slovnících a převedou do druhého jazyka.
4. Syntéza
Přeložené dílčí části se převedou do správné gramatické formy, věty se zkompletují.

Na abstrakci založený systém má tu nevýhodu, že málo zohledňuje kontext, takže může text přeložit ve zcela jiném významu.
Na trhu strojového překladu ještě existují systémy statistického zpracování jazyka, které vyhodnocují možné překlady na základě výpočtu jejich pravděpodobnosti. Trénují se na jazykových korpusech textů ve výchozím a cílovém jazyce.

Přestože se oba systémy v posledních letech k sobě přiblížily, mají k dokonalosti daleko.
Lidští překladatelé si tedy zatím nemusí dělat starosti o svá pracovní místa. A tlumočníci už vůbec ne. U systémů překladů mluveného jazyka se musejí překonat ještě úplně jiné překážky než při zpracování textových dokumentů.

Úřední jazyky EU:

– angličtina
– čeština
– dánština
– estonština
– finština
– francouzština
– irština (od r. 2007)
– italština
– litevština
– lotyština
– maďarština
– maltština
– němčina
– nizozemština
– polština
– portugalština
– řečtina
– slovenština
– slovinština
– španělština
– švédština