Siedma verzia hovoreného korpusu sprístupnená

Hovorený korpus s-hovor-7.0 obsahuje v najnovšej verzii 869 nahrávok, čo predstavuje 851 hodín zvukových záznamov v rozsahu 7 852 469 tokenov.

Textový prepis hovoreného korpusu je lematizovaný a morfologicky anotovaný, vyhľadávať sa dá na základe konkrétneho slova, lemy alebo výslovnosti. Pri prepisoch je uvedená sociolingvistická informácia o respondentoch a základné informácie o pôvode a obsahu nahrávky. Používateľom sú k dispozícii aj špeciálne značky používané v prepise hovorených prejavov, ktoré označujú napríklad nezrozumiteľný výraz, kašľanie, pauzy či časť výpovede v cudzom jazyku. Viac informácií o korpuse, jeho zložení a anotáciách nájdete tu.

Korpus možno využívať po bezplatnej registrácii.