Morfologická databáza

Morfologická databáza SNK obsahuje slovnodruhové a tvarové charakteristiky slov s priradením základného tvaru slova (lemy) ku každému konkrétnemu tvaru. V databáze sa nachádza cca 99 tisíc slov (lem) vybraných z dostupných slovníkov a doplnených o najfrekventovanejšie slová z korpusu. Ku každému základnému tvaru (leme) je priradená plná paradigma spolu so značkami zachytávajúcimi gramatické informácie. Databáza aktuálne obsahuje okolo 1,1 milióna unikátnych slovných tvarov, po zarátaní homoným je to celkovo 3,2 milióna záznamov. Používa sa pri automatickom značkovaní textov Slovenského národného korpusu.

Slovník podstatných mien je k dispozícii v slovníkovom rozhraní, kde sa ku každému tvaru generujú príklady z vybraných korpusov SNK.

Morfologická databáza sa buduje v SNK od r. 2005. Východiskovo bol využitý Model morfologickej databázy slovenčiny (Benko – Hašanová – Kostolanský, 2004), ďalší vývoj a postupy sú opísané v príslušných štúdiách a článkoch na tejto stránke, napr. (PDF), (PDF), (PDF).

Databázu je možné používať výlučne na vedecko-výskumné ciele v súlade s textami nasledujúcich licencií:

Súbory:

Vyhľadávanie:

Ukážka:

abakusabakusSSis1
abakusabakusuSSis2
abakusabakusuSSis3
abakusabakusSSis4
abakusabakusSSis5
abakusabakuseSSis6
abakusabakusomSSis7
abakusabakusySSip1
abakusabakusovSSip2
abakusabakusomSSip3
abakusabakusySSip4
abakusabakusySSip5
abakusabakusochSSip6
abakusabakusmiSSip7
abatišaabatišaSSfs1
abatišaabatišeSSfs2
abatišaabatišiSSfs3
abatišaabatišuSSfs4
abatišaabatišaSSfs5
abatišaabatišiSSfs6
abatišaabatišouSSfs7
abatišaabatišeSSfp1
abatišaabatíšSSfp2
abatišaabatišiamSSfp3
abatišaabatišeSSfp4
abatišaabatišeSSfp5
abatišaabatišiachSSfp6
abatišaabatišamiSSfp7
abažúrabažúrSSis1
abažúrabažúruSSis2
abažúrabažúruSSis3
abažúrabažúrSSis4
abažúrabažúrSSis5
abažúrabažúreSSis6
abažúrabažúromSSis7
abažúrabažúrySSip1
abažúrabažúrovSSip2
abažúrabažúromSSip3
abažúrabažúrySSip4
abažúrabažúrySSip5
abažúrabažúrochSSip6
abažúrabažúrmiSSip7