Slovenský hovorený korpus

Aktuálna verzia s-hovor-7.0 v rozsahu 7 852 469 textových jednotiek je prístupná od 28. marca 2022 a obsahuje 869 nahrávok, čo je viac ako 851 hodín zvukových záznamov.

Prvá verzia s-hovor bola sprístupnená 20. 12. 2008, verzia s-hovor-2.0 v januári 2010, verzia s-hovor-3.0 vo februári 2011, verzia s-hovor-4.0 v auguste 2012, verzia s-hovor-5.0 v apríli 2015, verzia s-hovor-6.0 v novembri 2017.

Od verzie s-hovor-6.0 sú používateľom k dispozícii značky používané v prepise v podobe štruktúrnych značiek a tiež možnosť vypočuť si príslušnú časť zvukového záznamu (turn.[ogg|spx|flac]) priamo vo vyhľadávacom nástroji NoSketch Engine. Od verzie s-hovor-4.0 sú k dispozícii aj dva subkorpusy: s-hovor-x-upn obsahuje len prepisy výpovedí pamätníkov z projektu Oral History Ústavu pamäti národa, s-hovor-x-sane obsahuje všetky ostatné nahrávky z primárneho hovoreného korpusu. K textovým prepisom nahrávok možno pristupovať prostredníctvom klienta Bonito (v rámci registrácie do Slovenského národného korpusu), v ktorom je prepis prepojený aj s príslušným segmentom zvukového záznamu.

Textový prepis (ortografická rovina) je lematizovaný a morfologicky anotovaný, pri prepisoch je uvedená sociolingvistická informácia o respondentoch a základné informácie o pôvode a obsahu nahrávky.

Vyhľadávať môžeme na základe konkrétneho slova, lemy alebo výslovnosti, vo výstupe nachádzame prepis podľa reálnej výslovnosti.