Zoznam článkov
V piatok 6. septembra 2024 budú korpusové databázy približne od 16.00 do 19.00 pre plánovanú technickú údržbu nedostupné. Ospravedlňujeme sa za spôsobené obmedzenia.
Korpus errkorp-pilot obsahuje 137 393 tokenov a nájdete ho po prihlásení sa do svojho konta SNK v NoSkE v časti Písané korpusy Akvizičné korpusy. Akvizičný korpus ERRKORP tvoria písané texty nerodených používateľov slovenčiny, v ktorých možno skúmať chyby vznikajúce v procese učenia sa slovenčiny ako cudzieho jazyka a vzájomné vzťahy medzi nimi. Viac informácií o korpuse,…
Najnovšia verzia webového korpusu obsahuje 4 373 231 228 tokenov. Podarilo sa nám v ňom kvalitatívne vylepšiť aj morfologickú anotáciu a lematizáciu. Pri textoch sú zároveň uvedené základné informácie o ich URL a čase získania. Viac informácií o korpuse, jeho zložení a anotáciách nájdete tu. Korpus možno využívať po bezplatnej registrácii.
Korpus písaných textov prim-10.0 obsahuje 1 688 211 881 tokenov. Najnovšia verzia predstavuje kvalitatívny skok v podobe prechodu na dokonalejšie softvérové nástroje, vylepšenia konfigurácie a zavedenia nástrojov a modelov vytvorených na pôde SNK, ako aj na iných pracoviskách (Jazykovedný ústav Ľudovíta Štúra SAV, v. v. i.). Viac informácií o korpuse, jeho zložení a anotáciách nájdete…