Bibliografická a štýlovo-žánrová anotácia

Bibliografická a štýlovožánrová anotácia je nevyhnutnou súčasťou prvotného spracovania textov v korpuse. Informácie o identite a základnej štruktúre textu sú dôležité pri jeho archivovaní, pri citovaní používateľmi, pri štatistickom vyhodnocovaní parametrov celého korpusu či zisťovaní distribúcie jazykových prostriedkov a javov v jednotlivých druhoch textov. Zobrazuje sa v spodnej časti okna klienta Bonito po kliknutí pravým tlačidlom myši na zvolený riadok v konkordančnom zozname. Anotáciu tvorí zoznam kľúčov a im priradených hodnôt, ktoré sú buď voľné (napr. meno autora), alebo vybrané z fixnej množiny povolených hodnôt (napr. žáner). Kľúče môžu označovať štýlovo-žánrové charakteristiky textu — hlavnými kategóriami sú v tomto prípade typ textu (umelecký, publicistický, odborný text, live komunikácia), žáner (napr. báseň, román, poviedka, článok) a doména, teda vecná oblasť, ktorej sa daný text týka (napr. umelecké vedy, právo, politika, ekonómia). Tieto hlavné kategórie sa ďalej delia na podkategórie. Ostatné kľúče zaznamenávajú bibliografické údaje a iné vlastnosti textu či informácie o autorovi. Zoznam kľúčov v plnom i skrátenom názve je v nasledujúcej tabuľke. Pod príslušným názvom kľúča sa nachádza opis jeho významu a vymenúvajú sa jeho možné hodnoty (ak nie sú voľné).

Externá anotácia

Anotácia je tvorená štruktúrou kľúč-hodnota. Hodnota môže byť buď voľná (príklad: meno autora) alebo vybraná z fixnej množiny povolených hodnôt (príklad: žáner). Na komplikované prípady zápisu informácií, ktoré nie je možné formalizovať do príslušnej hodnoty ŠŽA, slúžia hodnoty so špeciálnym významom (nie pre každý kľúč sú všetky zmysluplné):
(prázdne miesto, prípadne iba whitespace)
Default hodnota pri automatickej anotácii, predpokladá sa, že sa naozaj bude vyskytovať.
XXX
Neznáma hodnota. Nevieme určiť. Príklad: meno autora v novinovom článku.
YYY
Neurčiteľná hodnota. Z princípu sa nedá určiť alebo nemá význam. Príklad: pohlavie autora, ak ide o kolektívne dielo, pohlavie prekladateľa, že nejde o preložené dielo.
MIX
Mix. V prípade hodnoty vyberanej z fixnej množiny, pričom hľadaná hodnota je mixom viacerých hodnôt. Príklad: štýl pri literárnom časopise, v ktorom sú príspevky umeleckého aj odborného štýlu.
MSS
Iné. V prípade hodnoty vyberanej z fixnej množiny, pričom hľadaná hodnota nie je v danej množine určená. Príklad: žáner Programového vyhlásenia vlády.
TTT
Neznáma hodnota. Značka, že k danej anotácii sa nevyhnutne treba neskôr vrátiť a hodnotu doplniť.

Anotácia banky

Anotácia v banke je založená na zozname kľúčov a im priradených hodnôt, ktoré sú buď voľné (informácie o pôvode textov), alebo vyberané z fixnej množiny povolených hodnôt (označenia samotnej štruktúry textu a jeho štýlovo-žánrovej charakteristiky). Pod príslušným názvom kľúča je opísaný jeho význam a vymenované sú jeho možné hodnoty (ak nie sú voľné). 1. Základné kľúče s voľnými hodnotami:

Author (Auth)

  • Meno autora. Tak, ako je uvedené v zdrojoch k dokumentu podľa normy pre bibliografické zápisy.

Origauthor (OrgA)

  • Originálne meno autora, uvedené podľa pôvodného pravopisu a v pôvodnej jazykovej podobe. Vypĺňa sa len vtedy, ak ide o texty preložené z iných jazykov.

Translator (Trnr)

  • Meno prekladateľa. Špeciálna hodnota YYY je uvedená v prípade, že nejde o preložené dielo.

Bibliography (Bibl)

  • Bibliografické údaje, unifikované formy ich zápisu pre rôzne typy textov.

BOGOCONG (BOGO)

  • Skrátený formalizovaný niekoľkopísmenový zápis konkrétneho mena autora / mien autorov alebo názvu textu spolu s poradovým číslom textu. Uľahčuje orientáciu anotátorom v súboroch SNK a používateľom pri práci s vyhľadávanými kontextami.

Name (Name)

  • Názov textu.

Origname (OrgN)

  • Pôvodný názov textu, ak ide o preklad.

Conglomerate (Cong)

Identifikuje príslušnosť textu ku konkrétnemu konglomerátu (napr. pri rozdelených textoch či oddelení doslovu). Pozostáva z mena autora (Author) a názvu diela (Name), pri časopisoch z názvu, roku a čísla.

Comment (Comn)

  • Komentár. Slúži na prípadné spresnenie či doplnenie informácií o texte.

Date (Date)

  • Dátum, rok vydania.

Dateorig (OrgD)

  • Dátum, rok prvého vydania (môže byť zhodný s Date), pri prekladoch dátum, rok prvého vydania originálu.

ISBN (ISBN)

  • ISBN číslo.

ISSN (ISSN)

  • ISSN číslo.

SourceId (ScId)

  • Identifkačný kód, ktorý označuje miesto dokumentu v archíve, je rovnaký aj v banke, má podobu rok-mesiac-deň-písmeno podľa poradia (napr. napr. 2022-09-13-a). Rovnaký je aj vo všetkých anotovaných častiach prípadne rozdeleného dokumentu v banke.

Id (Id)

  • Identifikačný kód dokumentu v banke, podľa Id v archíve, má podobu rok-mesiac-deň-písmeno-číslo (napr. 2022-09-13-a-1). Číslo zohľadňuje počet častí, na ktoré sa pôvodný text v archíve pri konverzii do banky rozdelil.
2. Kľúče viazané na fixnú množinu hodnôt:

Translation (Trnn)

  • Označuje, či ide o originálny slovenský text alebo o text preložený z iného jazyka.
Hodnoty:
trn
preklad
org
originálny text
ftr
voľne preložený, prerozprávaný text
YYY
zmes prekladov a originálov (napr. súbor poviedok)

Rhyme (Rhym)

  • Označuje, či je text rýmovaný v zmysle rytmickej viazanosti alebo je nerýmovaný.
Hodnoty:
nrh
nerýmovaný
rhy
rýmovaný
MIX
sčasti rýmovaný a sčasti nie

Type (Type)

  • Typ textu, kľúč je dôležitý pri zaraďovaní textov do homogénnejších skupín, rozdeľujú sa ním texty do jednotlivých štýlov.
Hodnoty:
img
umelecký text
inf
publicistický (informatívny) text
prf
odborný text
liv
live komunikácia

Subtype (SubT)

  • Podtyp textu, rozšírené hodnoty slúžia na presnejšiu špecifikáciu štýlu (Type) textu.
Type a špecifikácia podľa Subtype
pre Type = imgpre Type = infpre Type = prfpre Type = liv
(umelecký text)(publicistický, informatívny text)(odborný text)(live komunikácia)
poe poéziapub publicistikasci vedecká literatúra, články, odborné časopisy, učebnice pre VŠspk hovorený
pro prózaadv reklamné materiály, reklamapop populárnovedecká literatúra, záujmové časopisywri písomný (internet, ďalekopis, ak je používaný interaktívne, komunikácia ľudí s poruchou reči písaním a pod.)
dra drámaadm administratívne textytxb učebnice pre stredné a základné školy
enc encyklopédie a podobné abecedne usporiadané diela
man manuály, návody na obsluhu, recepty, …

Genre (Genr)

  • Žáner, určuje ďalšie vlastnosti textov, stanovená je rozsiahla množina fixných hodnôt. Vlastnosti umeleckých textov sa ďalej určujú aj podľa subžánru (Subgenre). Medzi kľúčmi Type a Genre je úzka previazanosť, ktorú ilustruje tabuľka:
Genre v jednotlivých štýloch
pre Type = imgpre Type = infpre Type = prf
(umelecký text)(publicistický, informatívny text)(odborný text)
ver báseňdoc (dokumentárne) zápisnica, protokol, rezolúcia, zmluva; výročná správa, uzneseniemon monografia
son pieseň, libretoann (oznamovacie) smernice, vyhlášky, dotazníky, inzeráty, oznámenia, ponukyhnd príručka
scd divadelný scenár, divadelná hralst (heslovité) zoznamy, programy, pravidlá, stanovy, obsahy, tirážedis dizertačné, rigorózne práce
scf filmový scenár, titulky k filmurpt (spravodajské) správa, riport, interview, oznámenie, komunikéins pracovný návod
scr prepis rozhlasového vysielaniaanl (analytické) úvodník, komentár, glosa, recenzia, kritika, diskusia, polemika, debata, karikatúradpl diplomové, bakalárske a záverečné práce
nov románpbb (beletristické) fejtón, besednica, reportáž, črta, fíčer, stĺpčekstd štúdia
col poviedka, súbor poviedokspc prejavy (politické, príležitostné), príhovoryabs abstrakt
ess esejdsc diskusný, polemický/debatný príspevoktcl článok
dia rozhovoryrfl úvaha
mem memoáre, biografie, autobiografieref referát, seminárna práca
let listylct prednáška
chr kronikycrs charakteristika
sen krátke epické žánre (výroky, citáty, aforizmy, vtipy atď.)crt recenzia, kritika
fac literatúra faktuopn posudok

Subgenre (SubG)

  • pre Genre: nov, col, ver, fac (pre Genre ver a fac nie je Subgenre povinne voliteľný)
Hodnoty:
crm
detektívny, špionážny
scf
sci-fi, fantasy, mystery
adn
dobrodružný, westerny
rms
ženské romány, romance
bel
beletria
jun
pre deti a mládež
trv
cestopisy

Domain (Domn)

  • Doména, tematická oblasť (činnosti alebo poznania).
Hodnoty:
ars
umelecké vedy
hum
humanitné vedy
law
právo
nat
prírodné vedy
tec
technika
ecn
ekonómia, riadenie
blf
viera, nadprirodzeno
lif
lifestyle
ins
interdisciplinárne vedy
plt
politika
gov
štátna a verejná správa, samospráva

Subdomain (SubD)

  • Subdoména — bližšie určenie tematickej, odbornej oblasti.
    Pre Doménu „ins“ nie je Subdoména.
Rozsah vzťahov medzi Domain a Subdomain
pre Domain = arspre Domain = humpre Domain = lawpre Domain = natpre Domain = tec
mus hudba, opera, opereta, balethis história, archeológiabil zákony, nariadenia, predpisyagr poľnohospodárstvotra doprava, spoje, telekomunikácie
cin filmpsy psychológiajud judikatúrymed medicínaene energetika
arc architektúraedu pedagogikajur iné právnické textypha farmáciaind priemysel
art výtvarné umenie, fotografia, sochárstvosoc sociológia, komunikáciazoo zoológiacom informatika, počítače
the divadlo, divadelná veda a kritikaphi filozofia, estetikabot botanikabui stavebníctvo
lit literatúra, literárna veda a kritikainf knihovníctvo a informačné zdrojebio biológiasta normalizácia, štandardizácia
pol politológiache chémia
lin lingvistikamat matematika
eth etnológia, etnografia, antropológiaggr geografia
cul kulturológiaphy fyzika (aj astronómia)
swo sociálna prácamet meteorológia
mec masmediálna a marketingová komunikácia, médiá, reklamageo geológia
env environmentalistika, ekológia
pre Domain = ecnpre Domain = blfpre Domain = lifpre Domain = pltpre Domain = gov
eco ekonómia, bankovníctvo, obchodrel náboženstvo, viera, sektyhou domácnosť (byt, záhrada, ručné práce, kuchyňa, chovateľstvo)reg (voliteľné) regiónuso ústredné orgány; inštitúcie, centrá a podniky s celoštátnou pôsobnosťou
mng manažment, riadenieteo teológiafsh odievanie, módasam orgány miestnej správy a samosprávy
mer tovaroznalectvo, spotrebiteľská oblasťexc nadprirodzeno, okultné vedy, mágia, astrológiaspo športtvs odborné texty o verejnej správe a samospráve
sct spoločenský život
amu zábava, hra, koníčky, voľný čas, cestovanie
min národnostné kultúry
reg región
cnl poradňa
clt kultúra

Medium (Medi)

  • Médium, označuje dátový nosič alebo zdroj textu.
Hodnoty:
lib
kniha
ebk
e-kniha
nws
noviny
jou
časopis
ste
skriptá
net
internet a iné (pre-internetové) siete: internetové noviny, www stránky, e-mail, usenet príspevky, príspevky do diskusných fór, ako aj live komunikácia
for
formulár
occ
príležitostné (zborníky)
npu
nepublikované texty, rukopisy
tvf
televízia, kino
rad
rozhlas

Authsex (AutS)

  • Pohlavie autora.
Hodnoty:
msc
muž
fem
žena

Transsex (TrnS)

  • Pohlavie prekladateľa, pozri Authsex.

Varieta (Vari)

  • Variant jazyka dokumentu. Väčšinou bude spisovná slovenčina.
Hodnoty:
std
spisovná slovenčina
nst
neštandardná slovenčina
ost
starý štandard (pred pravopisnou reformou v roku 1953)

Paragraphs (Para)

  • Určuje, či je text v banke segmentovaný na odseky.
Hodnoty:
tru
text je segmentovaný na odseky
fls
z nejakého dôvodu je informácia o pôvodnej segmentácii stratená

Emphasis (Emph)

  • Určuje, či text v banke obsahuje informácie o pôvodnom zvýraznenom texte.
Hodnoty:
tru
áno
fls
nie

Diacritics (Dcrt)

  • Určuje, či text v banke obsahuje správnu diakritiku.
Hodnoty:
tru
text má správnu diakritiku
fls
text má nesprávnu (alebo chýbajúcu) diakritiku

Corrected (Corr)

  • Určuje, či dokument prešiel jazykovou korektúrou.
Hodnoty:
tru
áno
fls
nie

License (Lice)

  • Druh licencie podľa možného využitia dokumentu uvedeného v licenčnej zmluve v súlade s autorským zákonom (licencia 1 – 4). Vypĺňa sa už v archíve.

Lang (Lang)

  • Jazyk diela, označuje kód jazyka textu v banke podľa normy ISO 639-3. V našom prípade bude jazykom vždy slovenčina.

Origlang (OrgL)

  • Pôvodný jazyk diela podľa ISO 639-3, ak ide o preklad. Preklady z prekladov zapisujeme cez znak „>“. Príklad: eng>ger.