Najnovšia verzia webového korpusu sprístupnená

Najnovšia verzia webového korpusu obsahuje 4 373 231 228 tokenov. Podarilo sa nám v ňom kvalitatívne vylepšiť aj morfologickú anotáciu a lematizáciu. Pri textoch sú zároveň uvedené základné informácie o ich URL a čase získania. Viac informácií o korpuse, jeho zložení a anotáciách nájdete tu.

Korpus možno využívať po bezplatnej registrácii.