Top 1000 korpusu prim-4.0

Tisíc lem a slov, ktoré sa najčastejšie vyskytujú v jednotlivých podkorpusoch verzie prim-4.0.

prim-4.0-public-all

prim-4.0-public-img

prim-4.0-public-inf

prim-4.0-public-prf

prim-4.0-public-sane

prim-4.0-public-skimg

prim-4.0-vyv

Môžete si stiahnuť aj úplné frekvencie lem a slov v jednotlivých podkorpusoch tu. Textové súbory sú v UTF-8 kódovaní a sú skomprimované programom gzip.