Zoznam článkov
Najnovšia verzia webového korpusu obsahuje 4 373 231 228 tokenov. Podarilo sa nám v ňom kvalitatívne vylepšiť aj morfologickú anotáciu a lematizáciu. Pri textoch sú zároveň uvedené základné informácie o ich URL a čase získania. Viac informácií o korpuse, jeho zložení a anotáciách nájdete tu. Korpus možno využívať po bezplatnej registrácii.
Korpus písaných textov prim-10.0 obsahuje 1 688 211 881 tokenov. Najnovšia verzia predstavuje kvalitatívny skok v podobe prechodu na dokonalejšie softvérové nástroje, vylepšenia konfigurácie a zavedenia nástrojov a modelov vytvorených na pôde SNK, ako aj na iných pracoviskách (Jazykovedný ústav Ľudovíta Štúra SAV, v. v. i.). Viac informácií o korpuse, jeho zložení a anotáciách nájdete…
Bezplatné celodenné semináre Vyhľadávanie v korpusoch SNK sa uskutočnia v dňoch 6. – 8. júla 2022 v čase od 9:00 hod. do 15:00 hod. v zasadacej miestnosti Slovenského národného korpusu JÚĽŠ SAV. Prihlásiť sa je potrebné prostredníctvom webového formulára do 1. júla 2022 alebo do naplnenia voľných miest. Bližšie informácie o ponúkaných workshopoch nájdete na…
Hovorený korpus s-hovor-7.0 obsahuje v najnovšej verzii 869 nahrávok, čo predstavuje 851 hodín zvukových záznamov v rozsahu 7 852 469 tokenov. Textový prepis hovoreného korpusu je lematizovaný a morfologicky anotovaný, vyhľadávať sa dá na základe konkrétneho slova, lemy alebo výslovnosti. Pri prepisoch je uvedená sociolingvistická informácia o respondentoch a základné informácie o pôvode a obsahu…