Sprístupnili sme tretiu verziu korpusu textov cudzincov učiacich sa slovenčinu ako cudzí jazyk – errkorp-3.0. Táto verzia obsahuje 953 156 tokenov, čo je o 225-tisíc tokenov viac než v predchádzajúcej verzii. Nájdete ju po prihlásení sa do svojho konta SNK v časti Písané korpusy – Akvizičné korpusy.
Korpus tvorí 3 054 textov študentov s rôznymi materinskými jazykmi a úrovňami znalosti slovenčiny. Vyhľadávať možno:
- podľa správnych aj chybných slov;
- podľa konkrétnej značky chyby aj opravy;
- pomocou CQL.
Korpus možno využívať po bezplatnej registrácii.
Tvorbu tretej verzie korpusu ERRKORP po skončení projektu APVV zastrešuje Oddelenie Slovenského národného korpusu Jazykovedného ústavu Ľ. Štúra SAV, v. v. i., v rámci projektu Tvorba a rozvoj Slovenského národného korpusu (V. etapa).
Viac informácií nájdete na tomto odkaze.