Korpus textov z projektu OpenData

Otvorená a moderná verejná správa – zverejňovanie údajov štátnymi a inými verejnými inštitúciami dostupným spôsobom na internete. Zo samotnej povahy dát vyplýva, že obsahujú predovšetkým štatistické, číselné údaje, v niektorých prípadoch sa v nich však nachádza aj dostatočné množstvo textov z danej oblasti vhodných na korpusové spracovanie.

Z textov dostupných v rámci projektu OpenData bol v SNK vytvorený špecializovaný korpus textov súdnych rozhodnutí od-justice-1.0, sprístupnený 7. 12. 2018 v rozsahu vyše 4 miliardy tokenov.

Korpus je založený na dátach sprístupnených Ministerstvom spravodlivosti SR.

Korpus je lematizovaný a morfologicky anotovaný, pri textoch je uvedená základná informácia o URL, o čase a mieste ich vzniku. 

Najnovšia verzia je používateľom dostupná tu.