Tretia verzia korpusu textov cudzincov učiacich sa slovenčinu ako cudzí jazyk sprístupnená – ERRKORP

Sprístupnili sme tretiu verziu korpusu textov cudzincov učiacich sa slovenčinu ako cudzí jazyk – errkorp-3.0. Táto verzia obsahuje 953 156 tokenov, čo je o 225-tisíc tokenov viac než v predchádzajúcej verzii. Nájdete ju po prihlásení sa do svojho konta SNK v časti Písané korpusy – Akvizičné korpusy.

Korpus tvorí 3 054 textov študentov s rôznymi materinskými jazykmi a úrovňami znalosti slovenčiny. Vyhľadávať možno:

  • podľa správnych aj chybných slov;
  • podľa konkrétnej značky chyby aj opravy;
  • pomocou CQL.

Korpus možno využívať po bezplatnej registrácii

 


 

Tvorbu tretej verzie korpusu ERRKORP po skončení projektu APVV zastrešuje Oddelenie Slovenského národného korpusu Jazykovedného ústavu Ľ. Štúra SAV, v. v. i., v rámci projektu Tvorba a rozvoj Slovenského národného korpusu (V. etapa).

Viac informácií nájdete na tomto odkaze.