→English

Historický korpus slovenčiny

Nová verzia korpusu hist-4.0 bola sprístupnená 29. 11. 2016 v rozsahu 917 586 tokenov.

Historický korpus slovenčiny obsahuje v aktuálnej verzii nasledujúce dokumenty, z ktorých prvé štyri sú oproti predchádzajúcej verzii nové:

Texty v Historickom korpuse slovenčiny nie sú lematizované ani morfologicky anotované, vyhľadávať sa dá pomocou tvarov slov a CQL.

Verzia 3.0

Tretia verzia korpusu hist-3.0 bola sprístupnená 5. 2. 2015 v rozsahu 836 393 tokenov.

Verzia 2.0

Druhá verzia korpusu hist-2.0 bola sprístupnená 20. 10. 2014 v rozsahu 551 973 tokenov.

Oproti prvej verzii bola doplnená o korpusovo spracované texty z publikácií Hugolín Gavlovič: Valaská škola mravúv stodola, Jozef Ignác Bajza: Weselé Učinki, a Rečeňj a niekoľko ďalších menších historických textov.

Verzia 1.0

Prvá verzia korpusu hist-1.0 bola sprístupnená 30. 12. 2012 a obsahovala 370 758 tokenov korpusovo spracovaných textov z publikácií Pramene k dejinám slovenčiny 1., 2., 3.