Kolokat

KOLOKAT je nástroj na vizualizáciu kolokácií. Slúži na vizualizáciu vzdialenosti komponentov v (dvoj)slovných spojeniach v textových korpusoch.

Keďže niektoré slovné spojenia sú ustálené viac, iné menej, prostredníctvom grafického zobrazenia kolokácií sa dá vidieť, či je slovné spojenie „tesné“ alebo „voľné“, koľko slov sa medzi jednotlivými komponentmi nachádza a s akou početnosťou. Niektoré spojenia sú fixné (cica mica), pri iných môže byť druhé slovo rozvíjané inými atribútmi (dať pozor, ale aj dať veľký pozor, dať dobrý pozor, dať veľmi dobrý pozor), niekedy druhý člen „musí“ byť rozvinutý («veľvyslanec kráľovstva» sa prakticky nevyskytuje, vždy je to veľvyslanec Spojeného kráľovstva, veľvyslanec Španielskeho kráľovstva, veľvyslanec Belgického kráľovstva…) a pod.

Vyhľadávacie rozhranie najnovšej verzie kolokátu nájdete tu.

Najnovšia verzia bola sprístupnená v marci 2023 (rodina korpusov ARANEA). Nástroj je aktuálne vyvíjaný v Jazykovednom ústave Ľ. Štúra SAV mimo projektu Tvorba a rozvoj Slovenského národného projektu (V. etapa).

Nástroj bol pôvodne sprístupnený na stránke SNK v prvej verzii 30. 10. 2014 (iba pre slovenčinu, korpus prim-6.1-public-all).