Když překládá Google a Microsoft

Internet skýtá různé možnosti automatického překladu webových stránek. Také softwarové společnosti jako Google nebo Microsoft nabízejí v portfoliu svých  služeb překlad kliknutím myši. Výsledek však rozhodně nebývá dokonalý, působí často neohrabaně a někdy i komicky, např. když přeloží ‚kuličkové ložisko‚ jako ‚kulatou pohovku‚. Platí, že čím komplikovanější originál, tím horší překlad. Systémy jazykové statistiky by měly kvalitu automatických překladů zlepšit.

Microsoft (Windows Live Translator) sází na technologii firmy Systran, jednoho z nejstarších aktérů na poli strojového překladu. Její filozofie spočívá v rozpoznání slov podle kontextu ve větě, její struktury, a v dalším kroku poskládání přeložených slov v cílovém jazyce podle jeho gramatické struktury.

Google jde na to ve svém online řešení (Google Translate) jinak. Vychází z výsledků průzkumů firmy IBM, která navrhla strojový překlad řešit srovnáváním tzv. paralelních textů, tedy textů stejného obsahu, které jsou dostupné ve více jazykových verzích. Statistický překladový program analyzuje texty určené k překladu, srovnává je s paralelními texty ve své databázi a na statistickém základě navrhuje jejich překlad. Je schopen se učit a podávat stále lepší výsledky.

Předpokladem druhé metody je tedy neustálé rozšiřování databáze. Počítače zpracovávají překlady Bible a vícejazyčné texty OSN. Začátkem roku dostal výzkum v této oblasti k dispozici korpus překladů více než milionu dokumentů ve 23 úředních jazycích EU.

Zdá se, že budoucnost strojového překladu bude patřit právě statistickému softwaru. Americký National Institute of Standards and Technology, který testoval překlady čínských a arabských textů, hodnotil pozitivně právě řešení Googlu. Na škále mezi 0 a 1 dosáhly překlady od Googlu hodnoty 0,42.