Práve sme sprístupnili piatu verziu korpusu nárečí

Korpus nárečí dialekt-5.0 obsahuje v najnovšej verzii vyše 100 zdrojových textov v rozsahu 980 643 tokenov.

Texty v korpuse nárečí nie sú lematizované ani morfologicky anotované, avšak vyhľadávať sa v ňom sa dá na základe konkrétneho slova (word) a pomocou zástupných (meta)znakov. Pri prepisoch sú uvedené sociolingvistické údaje o informátoroch a explorátoroch, ako aj informácie o pôvode a obsahu nahrávky.

V korpuse je možné vyhľadávať po bezplatnej registrácii podľa pokynov na stránke https://korpus.sk/hladat-v-korpuse/s-registraciou/.