Zoznam článkov
Najnovšia verzia slovensko-anglického paralelného korpusu par-sken-5.0 obsahuje 526 mil. tokenov. Korpus sa skladá z dvoch častí: podkorpusu beletrie a podkorpusu voľne dostupných textov, najmä textov z inštitúcií Európskej únie. Viac informácií o korpuse, jeho zložení a anotáciách nájdete tu. Korpus možno využívať po bezplatnej registrácii.
V piatok 6. septembra 2024 budú korpusové databázy približne od 16.00 do 19.00 pre plánovanú technickú údržbu nedostupné. Ospravedlňujeme sa za spôsobené obmedzenia.
Korpus errkorp-pilot obsahuje 137 393 tokenov a nájdete ho po prihlásení sa do svojho konta SNK v NoSkE v časti Písané korpusy Akvizičné korpusy. Akvizičný korpus ERRKORP tvoria písané texty nerodených používateľov slovenčiny, v ktorých možno skúmať chyby vznikajúce v procese učenia sa slovenčiny ako cudzieho jazyka a vzájomné vzťahy medzi nimi. Viac informácií o korpuse,…
Najnovšia verzia webového korpusu obsahuje 4 373 231 228 tokenov. Podarilo sa nám v ňom kvalitatívne vylepšiť aj morfologickú anotáciu a lematizáciu. Pri textoch sú zároveň uvedené základné informácie o ich URL a čase získania. Viac informácií o korpuse, jeho zložení a anotáciách nájdete tu. Korpus možno využívať po bezplatnej registrácii.