Siedma verzia webového korpusu sprístupnená

Webový korpus web-7.0 obsahuje v najnovšej verzii 5 300 485 736 tokenov. V porovnaní s predchádzajúcou verziou webového korpusu 6.0 ide o nárast približne o jednu miliardu tokenov.

V najnovšej verzii webového korpusu bolo dosiahnuté kvalitatívne zlepšenie morfologickej anotácie a lematizácie spôsobom kompatibilným s hlavným korpusom prim-10.0. Pri textoch sú uvedené základné informácie o ich URL a čase získania.

Viac informácií o korpuse nájdete tu.

Obsah a rozsah korpusu môžete skúmať po bezplatnej registrácii.