Prvá verzia korpusu textov cudzincov učiacich sa slovenčinu ako cudzí jazyk sprístupnená – ERRKORP

V spolupráci s Filozofickou fakultou UK v Bratislave, Filozofickou fakultou PU v Prešove a Filozofickou fakultou UMB v Banskej Bystrici sme sprístupnili 1. verziu korpusu textov cudzincov učiacich sa slovenčinu ako cudzí jazyk.

Korpus errkorp-1.0 obsahuje 347 395 tokenov a nájdete ho po prihlásení sa do svojho konta SNK v časti Písané korpusy – Akvizičné korpusy.

Tvorí ho 1 063 textov študentov učiacich sa slovenčinu ako cudzí jazyk s rôznymi materinskými jazykmi a úrovňami znalostí slovenčiny. Táto verzia obsahuje na úrovni manuálnej anotácie značkovaných chýb kvalitatívne vylepšené dáta z pilotnej verzie korpusu a nové doplnené dáta. Viac informácií o korpuse, jeho zložení a anotáciách nájdete tu.

Korpus možno využívať po bezplatnej registrácii.

Tvorbu korpusu podporuje Agentúra na podporu výskumu a vývoja v rámci riešenia projektu APVV-19-0155.