Webový korpus web-7.0 obsahuje v najnovšej verzii 5 300 485 736 tokenov. V porovnaní s predchádzajúcou verziou webového korpusu 6.0 ide o nárast približne o jednu miliardu tokenov.
V najnovšej verzii webového korpusu bolo dosiahnuté kvalitatívne zlepšenie morfologickej anotácie a lematizácie spôsobom kompatibilným s hlavným korpusom prim-10.0. Pri textoch sú uvedené základné informácie o ich URL a čase získania.
Viac informácií o korpuse nájdete tu.
Obsah a rozsah korpusu môžete skúmať po bezplatnej registrácii.