Druhá verzia korpusu textov z rokov 1843 až 1954 sprístupnená

Sprístupnili sme druhú verziu korpusu textov z rokov 1843 až 1954 – r1843az1954-2.0. Táto verzia obsahuje 3 897 816 tokenov, čo je o 19 987 522 tokenov menej než v predchádzajúcej verzii. Prečo? Pretože cieľom bolo zachytiť autentický jazyk obdobia skutočného vydania! Najnovšiu verziu korpusu textov z rokov 1843 až 1954 nájdete po prihlásení do svojho konta SNK v časti – Písané korpusy – Časovo vymedzené korpusy.

Napriek výraznej selekcii, korpus tvoria texty s dobovým jazykom a gramatickými zásadami spisovnej slovenčiny v čase vydania, napr.:

  • Andrej Sládkovič: Svätomartiniada. Budín: V tlačiarni kr. uhor. university 1861.
  • Sbierka krajinských zákonov z roku 1868. Budín: Uhor. král. ministerstvo pravosudia 1868. (oficiálny preklad do slovenčiny)
  • Ján Babilon: Prvá kuchárska kniha v slovenskej reči. 1. sväzok, 2. sväzok. Pešť: Vlastným nákladom 1870.
  • Franko Chvojnický: Smejme sa! Sbierka vtipov, žartov, smiechot a hádanok. T. S. Martin: Knítlačiarsko-účastinársky spolok 1870.
  • Jan Fuchs: Počiatky silospytu (fiziky). Naukosklad prostonárodnej školy. Diel štvrtý. Pešťbudín: Majetok Viléma Lauffera 1879.
  • Význam kávovinového priemyslu na Slovensku. Bratislava: Franck továreň na kávoviny 1945.

Korpus možno využívať po bezplatnej registrácii

Viac informácií nájdete na tomto odkaze.