Malá statistika češtiny

Nejpoužívanější česká slova
a, být, ten, v, on, na, že, s(e), z(e), který, …

Podstatná jména
Podstatná jména představují 40 % české slovní zásoby. Nejčastější jsou v češtině: pán/pan, život, člověk, práce, ruka, den, zem(ě), lidé, doba, hlava, …

Slovesa
Slovesa představují 27 % české slovní zásoby. Nejčastější jsou v češtině: být, mít, moci, muset, vědět, chtít, jít, říci, vidět, dát (se), …

Přídavná jména
Přídavná jména představují 21 % české slovní zásoby. Nejčastější jsou v češtině: celý, vel(i)ký, nový, starý, národní, český, dobrý, malý, možný, živ(ý), …

Nejčastější písmena
Ze vzorku přes 3 mil. českých grafémů je s 8,7 % nejčastějším písmenem ‚o‘. Následují: e, n, a, t, v, s, i, l, k, …

Nejčastější koncová písmena
Nejvíce českých slov, přes 23 %, končí na písmeno ‚i‘. Dalšími písmeny v pořadí jsou ý, a, í, t, k, ě, o, v, n, l. Jen v 399 případech ze vzorku 193 000 slov končí na písmeno ‚h‘ (např. hloh, roh, stoh).