Zoznam článkov
Časovanie slovies v slovenčine – Práca Časovanie slovies v slovenčine nadväzuje na publikáciu Skloňovanie podstatných mien v slovenčine s korpusovými príkladmi a zameriava sa na zložitý systém konjugácie slovenských slovies. Východiskom je formálne spracovanie jazykových dát, formálny opis slovesných paradigiem sa však dopĺňa prostredníctvom systémovolingvistických poznatkov z oblasti morfematiky a morfológie. Členenie slovies sa kvôli…
Korpus errkorp-pilot obsahuje 137 393 tokenov a nájdete ho po prihlásení sa do svojho konta SNK v NoSkE v časti Písané korpusy Akvizičné korpusy. Akvizičný korpus ERRKORP tvoria písané texty nerodených používateľov slovenčiny, v ktorých možno skúmať chyby vznikajúce v procese učenia sa slovenčiny ako cudzieho jazyka a vzájomné vzťahy medzi nimi. Viac informácií o korpuse,…
Najnovšia verzia webového korpusu obsahuje 4 373 231 228 tokenov. Podarilo sa nám v ňom kvalitatívne vylepšiť aj morfologickú anotáciu a lematizáciu. Pri textoch sú zároveň uvedené základné informácie o ich URL a čase získania. Viac informácií o korpuse, jeho zložení a anotáciách nájdete tu. Korpus možno využívať po bezplatnej registrácii.
Korpus písaných textov prim-10.0 obsahuje 1 688 211 881 tokenov. Najnovšia verzia predstavuje kvalitatívny skok v podobe prechodu na dokonalejšie softvérové nástroje, vylepšenia konfigurácie a zavedenia nástrojov a modelov vytvorených na pôde SNK, ako aj na iných pracoviskách (Jazykovedný ústav Ľudovíta Štúra SAV, v. v. i.). Viac informácií o korpuse, jeho zložení a anotáciách nájdete…