Zoznam článkov
Korpus písaných textov prim-10.0 obsahuje 1 688 211 881 tokenov. Najnovšia verzia predstavuje kvalitatívny skok v podobe prechodu na dokonalejšie softvérové nástroje, vylepšenia konfigurácie a zavedenia nástrojov a modelov vytvorených na pôde SNK, ako aj na iných pracoviskách (Jazykovedný ústav Ľudovíta Štúra SAV, v. v. i.). Viac informácií o korpuse, jeho zložení a anotáciách nájdete…
Bezplatné celodenné semináre Vyhľadávanie v korpusoch SNK sa uskutočnia v dňoch 6. – 8. júla 2022 v čase od 9:00 hod. do 15:00 hod. v zasadacej miestnosti Slovenského národného korpusu JÚĽŠ SAV. Prihlásiť sa je potrebné prostredníctvom webového formulára do 1. júla 2022 alebo do naplnenia voľných miest. Bližšie informácie o ponúkaných workshopoch nájdete na…
Hovorený korpus s-hovor-7.0 obsahuje v najnovšej verzii 869 nahrávok, čo predstavuje 851 hodín zvukových záznamov v rozsahu 7 852 469 tokenov. Textový prepis hovoreného korpusu je lematizovaný a morfologicky anotovaný, vyhľadávať sa dá na základe konkrétneho slova, lemy alebo výslovnosti. Pri prepisoch je uvedená sociolingvistická informácia o respondentoch a základné informácie o pôvode a obsahu…
Korpus nárečí SNK dialekt-5.0 obsahuje v najnovšej verzii vyše 100 zdrojových textov v rozsahu 980 643 tokenov. Texty v korpuse nárečí nie sú lematizované ani morfologicky anotované, avšak vyhľadávať sa v ňom sa dá na základe konkrétneho slova (word) a pomocou zástupných (meta)znakov. Pri prepisoch sú uvedené sociolingvistické údaje o informátoroch a explorátoroch, ako aj…