Najnovšia siedma verzia hovoreného korpusu sprístupnená

Hovorený korpus s-hovor-7.0 obsahuje v najnovšej verzii 869 nahrávok, čo predstavuje 851 hodín zvukových záznamov v rozsahu 7 852 469 tokenov.

Textový prepis hovoreného korpusu je lematizovaný a morfologicky anotovaný, vyhľadávať sa dá na základe konkrétneho slova, lemy alebo výslovnosti. Pri prepisoch je uvedená sociolingvistická informácia o respondentoch a základné informácie o pôvode a obsahu nahrávky. Používateľom sú k dispozícii aj špeciálne značky používané v prepise hovorených prejavov, ktoré označujú napríklad nezrozumiteľný výraz, kašľanie, pauzy či časť výpovede v cudzom jazyku. Viac informácií o nich nájdete na webovej adrese https://korpus.sk/korpusy-a-databazy/korpusy/struktura-korpusu/verejne-pristupne-korpusy-snk/slovensky-hovoreny-korpus/strukturne-a-ine-znacky-s-hovor-5-0-a-skorsie/.

Na prehľadávanie korpusu ju potrebná bezplatná registrácia na stránke https://korpus.sk/hladat-v-korpuse/s-registraciou/.