Piata verzia korpusu nárečí SNK sprístupnená

Korpus nárečí SNK dialekt-5.0 obsahuje v najnovšej verzii vyše 100 zdrojových textov v rozsahu 980 643 tokenov.

Texty v korpuse nárečí nie sú lematizované ani morfologicky anotované, avšak vyhľadávať sa v ňom sa dá na základe konkrétneho slova (word) a pomocou zástupných (meta)znakov. Pri prepisoch sú uvedené sociolingvistické údaje o informátoroch a explorátoroch, ako aj informácie o pôvode a obsahu nahrávky. Viac informácií o korpuse, jeho zložení a anotáciách nájdete tu.

Korpus možno využívať po bezplatnej registrácii.