Zoznam článkov

Prvá verzia korpusu pomenovaných entít sprístupnená

Korpus pomenovaných entít snec-1.0 obsahuje vo svojej prvej verzii 468 715 tokenov v 201 textoch zo slobodnej encyklopédie Wikipédia, čo predstavuje viac ako 27 000 viet, v ktorých sa nachádza viac ako 67 000 označkovaných entít. Ručne anotované texty prešli supervíznou poloautomatizovanou kontrolou. Korpus tvoria dáta z projektu Koncepcia a realizácia sémantickej anotácie korpusu (identifikácia viacslovných…

»
INŠTRUKTÁŽNE VIDEO: Grafické zobrazenie slov v textoch SNK podľa rokov

Viete, že prostredníctvom funkcie Trendy možno zistiť, kedy sa vyhľadané slovo vyskytlo v textoch Slovenského národného korpusu prvýkrát, v akých rokoch sa vyskytuje najčastejšie či kedy jeho používanie klesá? Pozrite si krátke inštruktážne video o zobrazovaní frekvencie slov v konkrétnych rokoch v textoch SNK. Video je dostupné na našom YouTube kanáli, príp. na Facebookovej stránke Slovenského národného korpusu….

»