Korpus nárečí Slovenského národného korpusu (KN-SNK) sa začal pripravovať v oddelení SNK v roku 2013. Cieľom tohto čiastkového projektu SNK je zhromaždiť existujúce, predovšetkým už publikované textové prepisy nárečových zvukových alebo transkribovaných záznamov, jednotne ich spracovať korpusovou metodikou a nástrojmi a sprístupniť záujemcom o nárečový výskum.
Aktuálna verzia korpusu dialekt-5.0 bola sprístupnená 1.4. 2022 v rozsahu 980 643 tokenov. Nová verzia obsahuje vyše 100 zdrojových textov.
Predchádzajúca verzia korpusu dialekt-4.0 bola sprístupnená 18. 12. 2018 v rozsahu 711 766 tokenov. V rámci skvalitňovania korpusu došlo k zjednoteniu názvov zdrojov (doc.source). Zoznam spracovaných zdrojov v korpuse dialekt-4.0 je dostupný aj s plnými bibliografickými údajmi v časti textové zdroje.
Korpus nárečí nie je lematizovaný ani morfologicky anotovaný, vyhľadáva sa v ňom na základe konkrétneho slova (word) a pomocou zástupných (meta)znakov. Pri prepisoch sú uvedené sociolingvistické údaje o informátoroch a explorátoroch, ako aj informácie o pôvode a obsahu nahrávky. V korpuse sa dá vyhľadávať prostredníctvom NoSketch Engine po registrácii.
V nástroji NoSketch Engine je od 2. verzie korpusu k dispozícii klávesnica SNK-DIALEKT so špecifickými znakmi používanými v textoch Nárečového korpusu SNK. Od verzie dialekt-2.0 je korpus obohatený aj o špecifické štruktúrne značky.