Frekvenčný slovník hovorenej slovenčiny na báze Slovenského hovoreného korpusu

fshs-shk.png Frekvenčný slovník hovorenej slovenčiny na báze Slovenského hovoreného korpusu predstavuje prvé samostatné spracovanie výskytov slov a spojení v ústnej podobe štandardnej slovenčiny. Kolektív autorov z JÚĽŠ SAV v ňom nadväzuje na Frekvenčný slovník slovenčiny na báze Slovenského národného korpusu (Bratislava, 2017), v ktorom sú spracované výskyty slov v písaných textoch. Obidva slovníky tak poskytujú celistvý obraz o najpoužívanejšej časti slovnej zásoby súčasnej slovenčiny. Vo Frekvenčnom slovníku hovorenej slovenčiny sa nachádzajú výskyty slov a spojení slov v prehovoroch rôzneho druhu z celého územia Slovenska, ktoré sú spracované v Slovenskom hovorenom korpuse v rozsahu takmer 6,6 mil. textových jednotiek. Frekvenčný slovník obsahuje takmer 10 000 najfrekventovanejších slov usporiadaných podľa absolútnej frekvencie, podľa priemernej redukovanej frekvencie a podľa abecedy s rozšírenými frekvenčnými údajmi. V ďalších častiach sa nachádzajú frekvenčné zoznamy dvoj-, troj- a štvorslovných spojení slov, frekvenčné zoznamy slov použitých v osobitných komunikačných situáciách, skratiek a značiek, frekvenčné zoznamy grafém, slovných druhov a štruktúrnych značiek používaných v Slovenskom hovorenom korpuse.

GAJDOŠOVÁ, Katarína – ŠIMKOVÁ, Mária a kol.: Frekvenčný slovník hovorenej slovenčiny na báze Slovenského hovoreného korpusu. Bratislava: Veda 2018. 416 s. ISBN 978-80-224-1678-8

Slovenský národný korpus. Texty, anotácie, vyhľadávania

SNK-TAV.jpg Spoľahlivé elektronické zdroje sú v súčasnosti dôležité aj v spoločenských a humanitných vedách, pri výučbe jazykov či v práci prekladateľov, kde sa už viac rokov používajú aj zdroje Slovenského národného korpusu Jazykovedného ústavu Ľ. Štúra SAV. Tvorba, štruktúra a možnosti ich využitia sú súborne opísané v najnovšej kolektívnej práci, ktorá je určená lingvistom, učiteľom slovenského jazyka a cudzích jazykov na všetkých stupňoch škôl, prekladateľom, študentom a všetkým záujemcom o korpusové a jazykové databázy. V knihe možno nájsť okrem iného prehľad korpusov, podkorpusov a jazykových zdrojov Slovenského národného korpusu, podrobný opis dvoch základných anotácií (morfologickej a štýlovo-žánrovej), terminologický slovník, výber najčastejšie používaných metaznakov a metaoperátorov používaných pri vyhľadavaní, ako aj praktické ukážky (návody) postupov pri vyhľadávaní jazykových javov v rôznych korpusoch.

ŠIMKOVÁ, Mária – GAJDOŠOVÁ, Katarína – KMEŤOVÁ, Beáta – DEBNÁR, Marek: Slovenský národný korpus. Texty, anotácie, vyhľadávania. Bratislava: Jazykovedný ústav Ľ. Štúra SAV – Vydavateľstvo Mikula 2017. 168 s. ISBN 978-80-88814-98-6.

Slovník kolokácií prídavných mien v slovenčine

kolokacie-adj3.jpg Po Slovníku slovných spojení. Podstatné mená sa v Slovníku kolokácií prídavných mien v slovenčine zachytáva spájateľnosť slov z ďalšieho slovného druhu. V novom slovníku sú spracované kolokačné profily 500 najfrekventovanejších prídavných mien vybraných zo Slovenského národného korpusu. Jednotlivé kolokačné profily predstavujú vzorku rôznych typov slovných spojení s prídavným menom, ktoré reálne fungujú v slovenských textoch. Okrem kolokácií – typických spojení a ustálených viacslovných pomenovaní, ktoré tvoria základ kolokačného profilu každého prídavného mena, sú v rámci heslovej state osobitne vyčlenené frazémy a frázy. Slovník obsahuje aj štatistické prehľady, ktoré umožňujú čitateľovi porovnať spájateľnostný potenciál jednotlivých prídavných mien (najviac slovných spojení obsahuje heslo veľký – 239, najmenej heslo ústavný – 7), porovnať spájateľnosť prídavných mien so štatistickými hodnotami zo Slovenského národného korpusu, prípadne aj so spájateľnosťou podstatných mien. Slovník sa môže využiť ako východisko ďalšieho lexikologického, lexikografického alebo korpusového výskumu, dobrou pomôckou môže byť v prekladateľskej praxi, ako aj pri výučbe slovenského jazyka.

MAJCHRÁKOVÁ, Daniela – CHLPÍKOVÁ, Katarína – BOBEKOVÁ, Kristína: Slovník kolokácií prídavných mien v slovenčine. Bratislava: Veda 2017. 344 s. ISBN 978-80-224-1633-7.

Frekvenčný slovník slovenčiny na báze Slovenského národného korpusu

fsk.png Frekvenčný slovník slovenčiny na báze Slovenského národného korpusu vychádza po takmer 50 rokoch od prvého vydania slovníka tohto typu na Slovensku (Jozef Mistrík: Frekvencia slov v slovenčine. Bratislava: Vydavateľstvo Slovenskej akadémie vied 1969). Nový frekvenčný slovník zachytáva najfrekventovanejšie slová súčasnej slovenčiny, ako sa používali v rozpätí 25 rokov z prelomu 20. a 21. storočia. Frekvenčné údaje sú založené na textových a jazykových zdrojoch Slovenského národného korpusu Jazykovedného ústavu Ľ. Štúra SAV. Frekvenčný slovník slovenčiny na báze Slovenského národného korpusu obsahuje: Slovník lem podľa absolútnej frekvencie (28 456 najfrekventovanejších slov), Slovník lem podľa priemernej redukovanej frekvencie (28 477 najfrekventovanejších slov), Slovník lem podľa abecedy s rozšírenými frekvenčnými údajmi (rovnakých 28 477 najfrekventovanejších slov) a doplňujúce frekvenčné zoznamy: Frekvenčný zoznam interpunkčných znamienok, Frekvenčný zoznam grafických symbolov a číslic, Frekvenčný zoznam grafém, Frekvenčný zoznam grafém stojacich na začiatku slov, Frekvenčný zoznam slovných druhov.

GARABÍK, Radovan – KMEŤOVÁ, Beáta – ŠIMKOVÁ, Mária – ZUMRÍK, Miroslav a kol.: Frekvenčný slovník slovenčiny na báze Slovenského národného korpusu. Bratislava: Veda 2017. 562 s. ISBN 978-80-224-1630-6.

Slovník slovných spojení. Podstatné mená. 2. vyd.

nouns.png V druhom, doplnenom a upravenom vydaní slovníka sa zachytáva spájateľnosť 253 podstatných mien súčasnej slovenčiny. V záhlaví heslovej state je podstatné meno, nasleduje stručný výklad jeho významu, resp. významov a kolokačný profil podstatného mena. Kolokačné profily tvoria typické alebo ustálené a iné frekventované slovné spojenia s heslovým slovom usporiadané podľa slovnodruhovej príslušnosti do jednotlivých kolokačných štruktúr, singulárové a plurálové tvary slovných spojení sú spracované osobitne. Za Slovníkovou časťou nasleduje Štatistická analýza kolokačných profilov spracovaných v slovníku (metódy výberu hesiel, materiálové zdroje a štatistické metódy výberu slovných spojení) a štatistické tabuľky (celkový počet slovných spojení v jednotlivých heslách, zastúpenie slovných spojení v rámci jednotlivých kolokačných štruktúr). Publikáciu uzatvára Index hesiel (abecedný zoznam podstatných mien spracovaných v slovníku).

ĎURČO, Peter — MAJCHRÁKOVÁ, Daniela a kol.: Slovník slovných spojení. Podstatné mená. 2. vyd. Bratislava: Veda 2017. 394 s. ISBN 978-80-224-1612-2.

Jazykovedný časopis, 2017, roč. 68, č. 2 – SLOVKO 2017

slovko2017.png Tematické číslo Jazykovedného časopisu venované počítačovému spracovaniu prirodzeného jazyka, korpusovej lingvistike, terminológii a e-terminológii.

Jazykovedný časopis, 2017, roč. 68, č. 2, Eds. K. Gajdošová – A. Žáková. PDF

Skloňovanie podstatných mien v slovenčine s korpusovými príkladmi

sklonovanie.png Publikácia obsahuje 5 hlavných častí: "Predslov" (krátky kontext vzniku diela), "Úvod" (cieľ a obsah diela, použité metódy, zaujímavosti zo skloňovania podstatných mien v slovenčine), "Slovníková časť" (štruktúra hesla: heslové slovo = reprezentant skupiny slov s rovnakým skloňovaním, všetky tvary = paradigma reprezentanta, príklady na použitie jednotlivých tvarov v textoch z korpusu prim-7.0-frk, zoznam ďalších slov s rovnakou paradigmou), "Bibliografia textových zdrojov" (zoznam bibliografií textov citovaných v rámci príkladov skloňovania), "Abecedný zoznam slov s reprezentantmi príslušných skloňovacích typov" (register podstatných mien uvedených v slovníku s označením rodu a priradením k reprezentatovi). Ide o prvé komplexné korpusovolingvistické zachytenie deklinácie substantív.

GARABÍK, Radovan – KARČOVÁ, Agáta – ŠIMKOVÁ, Mária – BRÍDA, Radoslav – ŽÁKOVÁ, Adriána: Skloňovanie podstatných mien v slovenčine s korpusovými príkladmi. Bratislava: Jazykovedný ústav Ľ. Štúra SAV – Vydavateľstvo Mikula 2016. 656 s. ISBN: 978-80-88814-91-7.

SLOVKO 2015. Natural Language Processing, Corpus Linguistics, Lexicography. Počítačové spracovanie prirodzeného jazyka, korpusová lingvistika, lexikografia (2015)

slovko2015.png Zborník príspevkov z 8. bienálnej medzinárodnej vedeckej konferencie SLOVKO 2015 s podtitulom počítačové spracovanie prirodzeného jazyka, korpusová lingvistika, lexikografia obsahuje 15 vedeckých príspevkov venovaných oblastiam počítačového spracovania prirodzeného jazyka, korpusovej lingvistiky a e-lexikografie od autorov z Českej republiky, Francúzska, Rakúska, Slovenska a Slovinska. Štúdie v zborníku sú publikované v anglickom jazyku.

Natural Language Processing, Corpus Linguistics, Lexicography. SLOVKO 2015. Počítačové spracovanie prirodzeneého jazyka, korpusová lingvistika, lexikografia. Zborník z medzinárodnej vedeckej konferencie SLOVKO 2015. Ed. Katarína Gajdošová — Adriána Žáková. Lüdenscheid: RAM-Verlag 2015. 170 s. ISBN 978-3-942303-32-3. PDF

Jazykovedné štúdie XXXI. Rozvoj jazykových technológií a zdrojov na Slovensku a vo svete (10 rokov Slovenského národného korpusu) (2014)

snk102014.png Zborník pozostáva zo 14 vedeckých príspevkov 20 autorov zo 6 krajín, ktoré odzneli na rovnomennej konferencii. Prvé dva príspevky sa týkajú medzinárodných projektov META-NET a CESAR, ktoré združujú viacero európskych krajín, ostatných 12 článkov poskytuje informácie o stave a vývoji národných projektov predovšetkým z oblasti korpusovej lingvistiky, automatického spracovania reči, softvérových aplikácií a nástrojov na tvorbu lexikálnych zdrojov, ako aj špecifické využitie textových korpusov napríklad v boji proti plagiátorstvu. Zborník na ploche 190 strán ponúka nielen informačne nasýtené správy o súčasnej európskej spolupráci v oblasti jazykových technológií a jej potenciáli do budúcnosti, ale najmä pomerne vyčerpávajúci pohľad na projekty počítačového spracovania jazyka v jazykovom priestore slovenčiny, češtiny, ruštiny, bulharčiny a maďarčiny. (z posudku recenzentky zborníka J. Levickej) Štúdie v zborníku sú publikované v slovenskom a anglickom jazyku.

Jazykovedné štúdie XXXI. Rozvoj jazykových technológií a zdrojov na Slovensku a vo svete (10 rokov Slovenského národného korpusu). Ed. Katarína Gajdošová — Adriána Žáková. Bratislava: VEDA 2014. 190 s. ISBN 978-80-224-1391-6. PDF

Aktuálne otázky terminológie marketingu (2014)

aotm2014.png Zborník pozostáva zo 14 príspevkov najmä vysokoškolských pedagógov, pričom tri z nich sú od zahraničných autorov. Články sa zaoberajú nielen všeobecnými teoretickými otázkami prijímania neologizmov, zjednocovania terminológie alebo vplyvom angličtiny na slovenskú terminológiu marketingu, ale aj špecifickejšími analýzami v zmysle presného vymedzenia príbuzných termínov a hľadania ekvivalentov v slovenčine. (z Úvodu zborníka) Štúdie v zborníku sú publikované v slovenskom jazyku.

Aktuálne otázky terminológie marketingu. Zborník z medzinárodnej vedeckej konferencie. Ed. Jana Levická — Kristína Viestová. Bratislava: Slovenský národný korpus 2014.207 s. ISBN 978-80-971690-1-5. PDF

SLOVKO 2013

slovko2013.png Zborník príspevkov z medzinárodnej vedeckej konferencie SLOVKO 2013 obsahuje 26 vedeckých príspevkov venovaných oblastiam počítačového spracovania prirodzeného jazyka, korpusovej lingvistiky a e-learningu. Štúdie v zborníku sú publikované v anglickom jazyku.

Natural Language Processing, Corpus Linguistics, E-learning. SLOVKO 2013. Počítačové spracovanie prirodzeného jazyka, korpusová lingvistika, e-learning. Zborník z medzinárodnej vedeckej konferencie SLOVKO 2013. Ed. Katarína Gajdošová — Adriána Žáková. Lüdenscheid: RAM-Verlag 2013. 303 s. ISBN 978-3-942303-18-7. PDF

Slovenský jazyk v digitálnom veku – The Slovak Language in the Digital Age (2012)

sj_v_digitalnom_veku.png Publikácia vznikla s podporou projektu CESAR a METANET v spolupráci s autormi z celého Slovenska. Zhŕňa históriu vzniku slovenčiny, jej špecifiká oproti ostatným jazykom a osobitne v európskej informačnej spoločnosti a porovnanie stavu podpory pre 30 skúmaných európskych jazykov. Cieľom Série bielych kníh je upozorniť vlády a komerčné sféry krajín so slabou podporou vývoja jazykových technológií na zaostávanie v tejto oblasti a iniciovať ich záujem o zlepšenie situácie.

ŠIMKOVÁ, Mária — GARABÍK, Radovan — GAJDOŠOVÁ, Katarína — LACLAVÍK, Michal — ONDREJOVIČ, Slavomír — JUHÁR, Jozef — GENČI, Ján — FURDÍK, Karol — IVORÍKOVÁ, Helena — IVANECKÝ, Jozef: Slovenský jazyk v digitálnom veku – The Slovak Language in the Digital Age. Berlin – New York: Springer 2012. 85 s. ISBN 978-3-642-30370-8.

Neologizmy v terminológii marketingu (2010)

ntm2010.png Zborník Neologizmy v terminológii marketingu je jedným z výstupov projektu MŠ SR a SAV VEGA 2/0091/09 Spracovanie obchodnovednej terminológie pre potreby Slovenskej terminologickej databázy s dôrazom na analýzu terminologických neologizmov, ktorý Jazykovedný ústav Ľ. Štúra riešil v spolupráci s Obchodnou fakultou Ekonomickej univerzity v Bratislave. V zborníku možno nájsť 15 príspevkov, z toho sú dva články zo zahraničia. Témy zborníka sa dotýkajú všeobecných teoretických a praktických otázok, ako je problematika neologizmov, možnosti zjednocovania terminológie v oblasti marketingu či terminológie v procese prekladu. Druhá polovica autorov sa však zameriava na konkrétnejšiu problematiku: terminologické plánovanie vo frankofónnych krajinách, vývoj pojmu „spotřebitel“, vplyv angličtiny na slovenskú terminológiu marketingu, špecifikácia marketingovej terminológie v oblasti dopravy, problematika inovácií, snaha o harmonizáciu pojmov, presné vymedzenie a odlíšenie príbuzných termínov a hľadanie ekvivalentov v slovenčine. Zborník ako aj rovnomenný seminár spĺňa stanovený cieľ analyzovať aktuálne terminologické témy a ponúknuť ich riešenia.

Neologizmy v terminológii marketingu. Ed. Jana Levická — Kristína Viestová. Bratislava: Slovenský národný korpus 2010.137 s. ISBN 978-80-7399-944-5. PDF

SLOVKO 2011

slovko2011.png Zborník príspevkov z medzinárodnej vedeckej konferencie SLOVKO 2011 obsahuje 19 vedeckých príspevkov venovaných oblastiam počítačového spracovania prirodzeného jazyka a mnohojazyčnosti. Štúdie v zborníku sú publikované v anglickom jazyku.

Natural Language Processing, Multilinguality. Počítačové spracovanie prirodzeného jazyka, multilingválnosť. Zborník z medzinárodnej vedeckej konferencie SLOVKO 2011. Ed. Daniela Majchráková — Radovan Garabík. Brno: Tribun 2011. 180 s. ISBN 978-80-263-0049-6. PDF

SLOVKO 2009

slovko2009.png Zborník príspevkov z medzinárodnej vedeckej konferencie SLOVKO 2009 obsahuje 39 vedeckých príspevkov venovaných oblastiam počítačového spracovania prirodzeného jazyka, korpusovej lingvistike a gramatickému výskumu. Štúdie v zborníku sú publikované v anglickom jazyku.

NLP, Corpus Linguistics, Corpus Based Grammar Research. Počítačové spracovanie prirodzeného jazyka, korpusová lingvistika a gramatický výskum. Zborník z medzinárodnej vedeckej konferencie SLOVKO 2009. Ed. Jana Levická — Radovan Garabík. Brno: Tribun 2009. 405 s. ISBN 978-80-7399-875-2. PDF

Mondilex (2009)

mondilex2009.png Zborník príspevkov z medzinárodnej vedeckej konferencie Metalanguage and Encoding Scheme Design for Digital Lexicography obsahuje príspevky venované počítačovému spracovaniu a ukladaniu jazykových dát pre potreby všeobecnej lexikografie.

Metalanguage and Encoding Scheme Design for Digital Lexicography. Ed. Radovan Garabík. Brno: Tribune EU 2009.194 s. ISBN 978-80-7399-745-8. PDF

SLOVKO 2007

slovko2007.png Zborník príspevkov z medzinárodnej vedeckej konferencie SLOVKO 2007 obsahuje 34 vedeckých príspevkov venovaných oblastiam počítačového spracovania slovanských a východoeurópskych jazykov. Štúdie v zborníku sú publikované v anglickom a českom jazyku.

Computer Treatment of Slavic and East European Languages. Slovanské a východoeurópske jazyky v počítačovom spracovaní. Zborník z medzinárodnej vedeckej konferencie SLOVKO 2007. Ed. Jana Levická — Radovan Garabík. Brno: Tribun 2007. 315 s. ISBN 978-80-87139-05-9. PDF

Insight into the Slovak and Czech Corpus Linguistics (2006)

iiszcl2006.png Zborník Insight into Slovak and Czech Corpus Linguistics bol pôvodne koncipovaný ako súbor prednášok zahraničných počítačových a korpusových lingvistov, ktorí od 4. 11. 2002 do 28. 6. 2004 pravidelne prednášali v oddelení Slovenského národného korpusu Jazykovedného ústavu Ľ. Štúra Slovenskej akadémie vied v Bratislave. Na základe dodaných príspevkov a doplnení štúdií o aktuálnych výsledkoch v projekte Slovenského národného korpusu, anotáciách spracovaných textov a plánoch na korpusový morfosyntaktický výskum predstavuje publikácia vybraný súbor štúdií o stave korpusov a možnostiach i výsledkoch korpusovej lingvistiky v Slovenskej republike a v Českej republike v prvej polovici prvého desaťročia 21. storočia.

Insight into the Slovak and Czech Corpus Linguistics. Ed. Mária Šimková. Bratislava: Veda 2006. 208 s. ISBN 80-224-0880-8. PDF

SLOVKO 2005

slovko2005.png Zborník príspevkov z medzinárodnej vedeckej konferencie SLOVKO 2005 obsahuje 27 vedeckých príspevkov venovaných oblastiam počítačového spracovania slovanských a východoeurópskych jazykov. Štúdie v zborníku sú publikované v anglickom a jazyku.

Computer Treatment of Slavic and East European Languages. Slovanské a východoeurópske jazyky v počítačovom spracovaní. Zborník z medzinárodnej vedeckej konferencie SLOVKO 2005. Ed. Radovan Garabík. Bratislava: Veda 2005. 246 s. ISBN 80-224-0895-6. PDF