Korpus textov štátnej správy

Špecializovaný korpus textov štátnej správy gov-web-1.0 bol zverejnený 1. 2. 2019 v rozsahu 11 677 058 tokenov. Korpus bol vytvorený z textov štátnych inštitúcií dostupných na webových doménach gov a egov do polovice roka 2017.

Korpus bol vytvorený v SNK pre potreby tvorby termínov z oblasti štátnej správy v rámci projektu Slovenská terminologická databáza.

Korpus je lematizovaný a morfologicky anotovaný, pri textoch sú uvedené základné informácie o ich url a čase získania.