Zoznam článkov

Plánované prerušenie dostupnosti korpusových databáz

5. 9. 2024

V piatok 6. septembra 2024 budú korpusové databázy približne od 16.00 do 19.00 pre plánovanú technickú údržbu nedostupné. Ospravedlňujeme sa za spôsobené obmedzenia.

Pilotná verzia akvizičného korpusu ERRKORP sprístupnená

11. 8. 2022

Korpus errkorp-pilot obsahuje 137 393 tokenov a nájdete ho po prihlásení sa do svojho konta SNK v NoSkE v časti Písané korpusy Akvizičné korpusy. Akvizičný korpus ERRKORP tvoria písané texty nerodených používateľov slovenčiny, v ktorých možno skúmať chyby vznikajúce v procese učenia sa slovenčiny ako cudzieho jazyka a vzájomné vzťahy medzi nimi. Viac informácií o korpuse,…

Najnovšia verzia webového korpusu sprístupnená

17. 6. 2022

Najnovšia verzia webového korpusu obsahuje 4 373 231 228 tokenov. Podarilo sa nám v ňom kvalitatívne vylepšiť aj morfologickú anotáciu a lematizáciu. Pri textoch sú zároveň uvedené základné informácie o ich URL a čase získania. Viac informácií o korpuse, jeho zložení a anotáciách nájdete tu. Korpus možno využívať po bezplatnej registrácii.

Desiata verzia hlavného korpusu písaných textov prim-10.0 sprístupnená

16. 6. 2022

Korpus písaných textov prim-10.0 obsahuje 1 688 211 881 tokenov. Najnovšia verzia predstavuje kvalitatívny skok v podobe prechodu na dokonalejšie softvérové nástroje, vylepšenia konfigurácie a zavedenia nástrojov a modelov vytvorených na pôde SNK, ako aj na iných pracoviskách (Jazykovedný ústav Ľudovíta Štúra SAV, v. v. i.). Viac informácií o korpuse, jeho zložení a anotáciách nájdete…

« Predchádzajúca 1 2 3 4 … 7 Ďalej »

Zoznam článkov

Adresa

Telefón

Mobil

E-mail