Historický korpus hist-7.0 slovenčiny obsahuje v najnovšej verzii 981 000 tokenov.
Zahŕňa texty z predspisovného obdobia slovenčiny z vlastného prepisu aj už z publikovaných textov. Texty v historickom korpuse nie sú lematizované ani morfologicky anotované, dá sa v ňom vyhľadávať pomocou tvarov slov a pomocou CQL. Vyhľadávanie bolo zjednodušené na úrovni špeciálnych znakov, to znamená, že znaky s diakritikou vieme vyhľadávať jednoducho aj bez diakritiky. Nová verzia má upravené značenie a zjednotenú anotáciu.
Viac informácií o korpuse, jeho zložení a anotáciách nájdete tu.
Korpus možno využívať po bezplatnej registrácii.