Nové jazyky v Google Translate: arménština, ázerbájdžánština, baskičtina, gruzínština, urdština

Arménština, ázerbájdžánština, baskičtina, gruzínština a urdština se staly novými jazyky v portfoliu online překladače Google Translate. Mimo evropské baskičtiny se všechny používají v Asii a mají dohromady přibližně 100 milionů mluvčích. Celkový počet aktuálně nabízených jazyků služby Google Translate tak dosahuje 57.

Základní informace o nových jazycích

Arménština

– kód ISO 639-1: hy (= hajeren)
– samostatná větev indoevropských jazyků
– cca 6,5 mil. mluvčích, z toho přes 3 mil. v Arménii
– východní arménština úřední jazyk v Arménii (3 mil. mluvčích), jazyk menšiny v Íránu, západní arménština je jazykem menšin v Turecku, Libanonu, Sýrii, Iráku atd.
– aglutinační jazyk s 6, resp. 7 pády, rod se nerozlišuje
– samohlásky nerozlišují délku
– slovní zásoba ovlivněna perštinou, řečtinou, kavkazskými jazyky, francouzštinou a ruštinou
– 5.–11. stol. nejstarší literární památky (grabar – dnes církevní jazyk)
– v 19. stol. vzniká novější spisovný jazyk ašcharhabar
– vytvoření arménského písma v r. 405–406, od 12. stol. rozšířeno na 39 znaků
– 1922–1924 pravopisná reforma

Ázerbájdžánština

– kód ISO 639-1: az (ázerí)
– oguzská skupina turkických jazyků
– severní variantou hovoří 7,5 mil. mluvčích, v Ázerbájdžánu jako národním jazykem (6,1 mil., z toho 4 mil. monolingvních), Íránu, menšiny v Arménii a Gruzii, 8 mil. jako mluvčích druhého jazyka; jižní variantou 12,6 mil., hlavně v Íránu (11,2 mil.)
– vliv perštiny, arabštiny, mongolštiny, ruštiny
– vokalická harmonie
– nejstarší texty ze 14. stol., jako turečtina – jednotný jazyk Osmanské říše, 15. až 16. stol. odštěpení, vliv čaghatajštiny
– do 1. poloviny 19. stol. součást Persie – dvojjazyčnost gramotných Ázerbájdžánců, poté moderní poezie
– před r. 1917 lingua franca v Zakavkazsku
– dnešní (severní) spisovný jazyk je založen na jazyce kulturních pracovníků v Baku na začátku 20. století, nadnářeční, bez osmanismů
– 1923 bylo v severní variantě arabské písmo nahrazeno latinkou a od konce 30. let azbukou, od r. 1991 opět latinka; jižní varianta se píše latinkou nebo arabským písmem (Irák), příp. azbukou (Afghánistán)

Baskičtina

– kód ISO 639-1: eu (= euskara)
– izolovaný jazyk neznámého původu
– 660 tis. mluvčích ve Španělsku (lokální úřední jazyk v Autonomním společenství Baskicko) a Francii (department Pyrénées-Atlantiques), etnického původu je přes 2,7 mil. osob
– aglutinační jazyk, nerozlišuje rody
– číslice ve dvacítkové soustavě
– fonetický pravopis v latince
– hláskosloví ovlivněno španělštinou, resp. francouzštinou, slovní zásoba ovlivněna latinou, arabštinou, románskými a keltskými jazyky
– první psaný záznam z 11. stol., nejstarší literární památky z 16. století
– 1587 první mluvnice
– do 19. století převážně náboženské texty
– 1919 založena Akademie baskického jazyka, 1968 standardizace jazyka (Euskara Batua)

Gruzínština

– kód ISO 639-1: ka (= kartuli ena)
– jazyk jižní větve kavkazských jazyků
– přes 4 mil. mluvčích, naprostá většina žije v Gruzii, dále v Ázerbájdžánu, menšiny v Íránu a Turecku
– aglutinační jazyk
– slovní zásoba se rozšiřuje skládáním a odvozováním, přejímky z řečtiny, arménštiny, arabštiny, perštiny, ruštiny, evropských jazyků
– čísla v dvacítkové soustavě
– dnešní zleva doprava psané fonologické písmo mchedruli s 33 písmeny se ustálilo v 18. stol., velká písmena se zpravidla nepoužívají, navazuje na dřívější písmo, které se objevilo v 5. stol.
– 5.–12. stol. starogruzínský spis. jazyk – bohatá literatura, vrchol Rustaveliho hrdinský epos
– od 12. stol. novogruzínština – hlavně světská literatura
– 19. stol. vytvoření dnešní podoby gruzínštiny

Urdština

– kód ISO 639-1: ur (= urdu)
– indoárijský jazyk, „poetičtější“ varianta hindustánštiny (sociolekty urdština a hindština)
– 10,7 mil. rodilých mluvčích v Pákistánu (úřední jazyk), 104 mil. Pákistánců hovoří urdštinou jako národním jazykem; celkem 60,6 mil. rodilých mluvčích na celém světě, z toho 48 mil. v Indii (úřední jazyk v 6 spolkových státech)
– silný vliv perštiny a arabštiny, výpůjčky z portugalštiny
– píše se upraveným arabským písmem
– literární památky od 14. stol.
– 1952 demonstrace Bengálců proti urdštině jako jedinému úřednímu jazyku Pákistánu

Všech 5 jazyků je zatím ve stadiu alfa a jsou dostupné jen v anglické verzi překladače. Před několika dny byla v Google Translate mimoto rozšířena funkce hlasové syntézy překladu na celkem 34 jazyků.