Slovensko-maďarský paralelný korpus v najnovšej verzii obsahuje 51 miliónov tokenov v slovenskej časti a 48 miliónov tokenov v maďarskej časti. Novinkou oproti predchádzajúcej verzii je rozsiahla anotácia textov v slovenskej a aj v maďarskej časti, ktorá je šesťnásobne bohatšia a umožňuje detailnejšie vyhľadávanie podľa charakteru textu či autora. Viac informácií o korpuse, jeho zložení a anotáciách nájdete tu.
Veríme, že naše paralelné korpusy môžu prispieť k ďalším možnostiam nielen komparatívneho výskumu, ale aj translatológie.
Korpus možno využívať po bezplatnej registrácii.