Bibliografická a štýlovo-žánrová anotácia

Bibliografická a štýlovožánrová anotácia je nevyhnutnou súčasťou prvotného spracovania textov v korpuse. Informácie o identite a základnej štruktúre textu sú dôležité pri jeho archivovaní, pri citovaní používateľmi, pri štatistickom vyhodnocovaní parametrov celého korpusu či zisťovaní distribúcie jazykových prostriedkov a javov v jednotlivých druhoch textov. Zobrazuje sa v spodnej časti okna klienta Bonito po kliknutí pravým tlačidlom myši na zvolený riadok v konkordančnom zozname. Anotáciu tvorí zoznam kľúčov a im priradených hodnôt, ktoré sú buď voľné (napr. meno autora), alebo vybrané z fixnej množiny povolených hodnôt (napr. žáner). Kľúče môžu označovať štýlovo-žánrové charakteristiky textu — hlavnými kategóriami sú v tomto prípade typ textu (umelecký, publicistický, odborný text, live komunikácia), žáner (napr. báseň, román, poviedka, článok) a doména, teda vecná oblasť, ktorej sa daný text týka (napr. umelecké vedy, právo, politika, ekonómia). Tieto hlavné kategórie sa ďalej delia na podkategórie. Ostatné kľúče zaznamenávajú bibliografické údaje a iné vlastnosti textu či informácie o autorovi. Zoznam kľúčov v plnom i skrátenom názve je v nasledujúcej tabuľke. Pod príslušným názvom kľúča sa nachádza opis jeho významu a vymenúvajú sa jeho možné hodnoty (ak nie sú voľné).

Externá anotácia

Anotácia je tvorená štruktúrou kľúč-hodnota. Hodnota môže byť buď voľná (príklad: meno autora) alebo vybraná z fixnej množiny povolených hodnôt (príklad: žáner). Na komplikované prípady zápisu informácií, ktoré nie je možné formalizovať do príslušnej hodnoty ŠŽA, slúžia hodnoty so špeciálnym významom (nie pre každý kľúč sú všetky zmysluplné):

(prázdne miesto, prípadne iba whitespace)
Default hodnota pri automatickej anotácii, predpokladá sa, že sa naozaj bude vyskytovať.
XXX
Neznáma hodnota. Nevieme určiť. Príklad: meno autora v novinovom článku.
YYY
Neurčiteľná hodnota. Z princípu sa nedá určiť alebo nemá význam. Príklad: pohlavie autora, ak ide o kolektívne dielo, pohlavie prekladateľa, že nejde o preložené dielo.
MIX
Mix. V prípade hodnoty vyberanej z fixnej množiny, pričom hľadaná hodnota je mixom viacerých hodnôt. Príklad: štýl pri literárnom časopise, v ktorom sú príspevky umeleckého aj odborného štýlu.
MSS
Iné. V prípade hodnoty vyberanej z fixnej množiny, pričom hľadaná hodnota nie je v danej množine určená. Príklad: žáner Programového vyhlásenia vlády.
TTT
Neznáma hodnota. Značka, že k danej anotácii sa nevyhnutne treba neskôr vrátiť a hodnotu doplniť.

Anotácia banky

Anotácia v banke je založená na zozname kľúčov a im priradených hodnôt, ktoré sú buď voľné (informácie o pôvode textov), alebo vyberané z fixnej množiny povolených hodnôt (označenia samotnej štruktúry textu a jeho štýlovo-žánrovej charakteristiky). Pod príslušným názvom kľúča je opísaný jeho význam a vymenované sú jeho možné hodnoty (ak nie sú voľné).

1. Základné kľúče s voľnými hodnotami:

Author (Auth)

  • Meno autora. Tak, ako je uvedené v zdrojoch k dokumentu podľa normy pre bibliografické zápisy.

Origauthor (OrgA)

  • Originálne meno autora, uvedené podľa pôvodného pravopisu a v pôvodnej jazykovej podobe. Vypĺňa sa len vtedy, ak ide o texty preložené z iných jazykov.

Translator (Trnr)

  • Meno prekladateľa. Špeciálna hodnota YYY je uvedená v prípade, že nejde o preložené dielo.

Bibliography (Bibl)

  • Bibliografické údaje, unifikované formy ich zápisu pre rôzne typy textov.

BOGOCONG (BOGO)

  • Skrátený formalizovaný niekoľkopísmenový zápis konkrétneho mena autora / mien autorov alebo názvu textu spolu s poradovým číslom textu. Uľahčuje orientáciu anotátorom v súboroch SNK a používateľom pri práci s vyhľadávanými kontextami.

Name (Name)

  • Názov textu.

Origname (OrgN)

  • Pôvodný názov textu, ak ide o preklad.

Conglomerate (Cong)

Identifikuje príslušnosť textu ku konkrétnemu konglomerátu (napr. pri rozdelených textoch či oddelení doslovu). Pozostáva z mena autora (Author) a názvu diela (Name), pri časopisoch z názvu, roku a čísla.

Comment (Comn)

  • Komentár. Slúži na prípadné spresnenie či doplnenie informácií o texte.

Date (Date)

  • Dátum, rok vydania.

Dateorig (OrgD)

  • Dátum, rok prvého vydania (môže byť zhodný s Date), pri prekladoch dátum, rok prvého vydania originálu.

ISBN (ISBN)

  • ISBN číslo.

ISSN (ISSN)

  • ISSN číslo.

SourceId (ScId)

  • Identifkačný kód, ktorý označuje miesto dokumentu v archíve, je rovnaký aj v banke, má podobu rok-mesiac-deň-písmeno podľa poradia (napr. napr. 2022-09-13-a). Rovnaký je aj vo všetkých anotovaných častiach prípadne rozdeleného dokumentu v banke.

Id (Id)

  • Identifikačný kód dokumentu v banke, podľa Id v archíve, má podobu rok-mesiac-deň-písmeno-číslo (napr. 2022-09-13-a-1). Číslo zohľadňuje počet častí, na ktoré sa pôvodný text v archíve pri konverzii do banky rozdelil.

2. Kľúče viazané na fixnú množinu hodnôt:

Translation (Trnn)

  • Označuje, či ide o originálny slovenský text alebo o text preložený z iného jazyka.

Hodnoty:

trn
preklad
org
originálny text
ftr
voľne preložený, prerozprávaný text
YYY
zmes prekladov a originálov (napr. súbor poviedok)

Rhyme (Rhym)

  • Označuje, či je text rýmovaný v zmysle rytmickej viazanosti alebo je nerýmovaný.
Hodnoty:
nrh
nerýmovaný
rhy
rýmovaný
MIX
sčasti rýmovaný a sčasti nie

Type (Type)

  • Typ textu, kľúč je dôležitý pri zaraďovaní textov do homogénnejších skupín, rozdeľujú sa ním texty do jednotlivých štýlov.
Hodnoty:
img
umelecký text
inf
publicistický (informatívny) text
prf
odborný text
liv
live komunikácia

Subtype (SubT)

  • Podtyp textu, rozšírené hodnoty slúžia na presnejšiu špecifikáciu štýlu (Type) textu.
Type a špecifikácia podľa Subtype
pre Type = imgpre Type = infpre Type = prfpre Type = liv
(umelecký text)(publicistický, informatívny text)(odborný text)(live komunikácia)
poe
poézia
pub
publicistika
sci
vedecká literatúra, články, odborné časopisy, učebnice pre VŠ
spk
hovorený
pro
próza
adv
reklamné materiály, reklama
pop
populárnovedecká literatúra, záujmové časopisy
wri
písomný (internet, ďalekopis, ak je používaný interaktívne, komunikácia ľudí s poruchou reči písaním a pod.)
dra
dráma
adm
administratívne texty
txb
učebnice pre stredné a základné školy
 
  enc
encyklopédie a podobné abecedne usporiadané diela
 
  man
manuály, návody na obsluhu, recepty, …
 

Genre (Genr)

  • Žáner, určuje ďalšie vlastnosti textov, stanovená je rozsiahla množina fixných hodnôt. Vlastnosti umeleckých textov sa ďalej určujú aj podľa subžánru (Subgenre). Medzi kľúčmi Type a Genre je úzka previazanosť, ktorú ilustruje tabuľka:
Genre v jednotlivých štýloch
pre Type = imgpre Type = infpre Type = prf
(umelecký text)(publicistický, informatívny text)(odborný text)
ver
báseň
doc (dokumentárne)
zápisnica, protokol, rezolúcia, zmluva; výročná správa, uznesenie
mon
monografia
son
pieseň, libreto
ann (oznamovacie)
smernice, vyhlášky, dotazníky, inzeráty, oznámenia, ponuky
hnd
príručka
scd
divadelný scenár, divadelná hra
lst (heslovité)
zoznamy, programy, pravidlá, stanovy, obsahy, tiráže
dis
dizertačné, rigorózne práce
scf
filmový scenár, titulky k filmu
rpt (spravodajské)
správa, riport, interview, oznámenie, komuniké
ins
pracovný návod
scr
prepis rozhlasového vysielania
anl (analytické)
úvodník, komentár, glosa, recenzia, kritika, diskusia, polemika, debata, karikatúra
dpl
diplomové, bakalárske a záverečné práce
nov
román
pbb (beletristické)
fejtón, besednica, reportáž, črta, fíčer, stĺpček
std
štúdia
col
poviedka, súbor poviedok
spc
prejavy (politické, príležitostné), príhovory
abs
abstrakt
ess
esej
dsc
diskusný, polemický/debatný príspevok
tcl
článok
dia
rozhovory
 rfl
úvaha
mem
memoáre, biografie, autobiografie
 ref
referát, seminárna práca
let
listy
 lct
prednáška
chr
kroniky
 crs
charakteristika
sen
krátke epické žánre (výroky, citáty, aforizmy, vtipy atď.)
 crt
recenzia, kritika
fac
literatúra faktu
 opn
posudok

Subgenre (SubG)

  • pre Genre: nov, col, ver, fac (pre Genre ver a fac nie je Subgenre povinne voliteľný)
Hodnoty:
crm
detektívny, špionážny
scf
sci-fi, fantasy, mystery
adn
dobrodružný, westerny
rms
ženské romány, romance
bel
beletria
jun
pre deti a mládež
trv
cestopisy

Domain (Domn)

  • Doména, tematická oblasť (činnosti alebo poznania).
Hodnoty:
ars
umelecké vedy
hum
humanitné vedy
law
právo
nat
prírodné vedy
tec
technika
ecn
ekonómia, riadenie
blf
viera, nadprirodzeno
lif
lifestyle
ins
interdisciplinárne vedy
plt
politika
gov
štátna a verejná správa, samospráva

Subdomain (SubD)

  • Subdoména — bližšie určenie tematickej, odbornej oblasti.
    Pre Doménu „ins“ nie je Subdoména.
Rozsah vzťahov medzi Domain a Subdomain
pre Domain = arspre Domain = humpre Domain = lawpre Domain = natpre Domain = tec
mus
hudba, opera, opereta, balet
his
história, archeológia
bil
zákony, nariadenia, predpisy
agr
poľnohospodárstvo
tra
doprava, spoje, telekomunikácie
cin
film
psy
psychológia
jud
judikatúry
med
medicína
ene
energetika
arc
architektúra
edu
pedagogika
jur
iné právnické texty
pha
farmácia
ind
priemysel
art
výtvarné umenie, fotografia, sochárstvo
soc
sociológia, komunikácia
 zoo
zoológia
com
informatika, počítače
the
divadlo, divadelná veda a kritika
phi
filozofia, estetika
 bot
botanika
bui
stavebníctvo
lit
literatúra, literárna veda a kritika
inf
knihovníctvo a informačné zdroje
 bio
biológia
sta
normalizácia, štandardizácia
 pol
politológia
 che
chémia
 
 lin
lingvistika
 mat
matematika
 
 eth
etnológia, etnografia, antropológia
 ggr
geografia
 
 cul
kulturológia
 phy
fyzika (aj astronómia)
 
 swo
sociálna práca
 met
meteorológia
 
 mec
masmediálna a marketingová komunikácia, médiá, reklama
 geo
geológia
 
   env
environmentalistika, ekológia
 
pre Domain = ecnpre Domain = blfpre Domain = lifpre Domain = pltpre Domain = gov
eco
ekonómia, bankovníctvo, obchod
rel
náboženstvo, viera, sekty
hou
domácnosť (byt, záhrada, ručné práce, kuchyňa, chovateľstvo)
reg (voliteľné)
región
uso
ústredné orgány; inštitúcie, centrá a podniky s celoštátnou pôsobnosťou
mng
manažment, riadenie
teo
teológia
fsh
odievanie, móda
 sam
orgány miestnej správy a samosprávy
mer
tovaroznalectvo, spotrebiteľská oblasť
exc
nadprirodzeno, okultné vedy, mágia, astrológia
spo
šport
 tvs
odborné texty o verejnej správe a samospráve
  sct
spoločenský život
  
  amu
zábava, hra, koníčky, voľný čas, cestovanie
  
  min
národnostné kultúry
  
  reg
región
  
  cnl
poradňa
  
  clt
kultúra
  

Medium (Medi)

  • Médium, označuje dátový nosič alebo zdroj textu.
Hodnoty:
lib
kniha
ebk
e-kniha
nws
noviny
jou
časopis
ste
skriptá
net
internet a iné (pre-internetové) siete: internetové noviny, www stránky, e-mail, usenet príspevky, príspevky do diskusných fór, ako aj live komunikácia
for
formulár
occ
príležitostné (zborníky)
npu
nepublikované texty, rukopisy
tvf
televízia, kino
rad
rozhlas

Authsex (AutS)

  • Pohlavie autora.
Hodnoty:
msc
muž
fem
žena

Transsex (TrnS)

  • Pohlavie prekladateľa, pozri Authsex.

Varieta (Vari)

  • Variant jazyka dokumentu. Väčšinou bude spisovná slovenčina.
Hodnoty:
std
spisovná slovenčina
nst
neštandardná slovenčina
ost
starý štandard (pred pravopisnou reformou v roku 1953)

Paragraphs (Para)

  • Určuje, či je text v banke segmentovaný na odseky.
Hodnoty:
tru
text je segmentovaný na odseky
fls
z nejakého dôvodu je informácia o pôvodnej segmentácii stratená

Emphasis (Emph)

  • Určuje, či text v banke obsahuje informácie o pôvodnom zvýraznenom texte.
Hodnoty:
tru
áno
fls
nie

Diacritics (Dcrt)

  • Určuje, či text v banke obsahuje správnu diakritiku.
Hodnoty:
tru
text má správnu diakritiku
fls
text má nesprávnu (alebo chýbajúcu) diakritiku

Corrected (Corr)

  • Určuje, či dokument prešiel jazykovou korektúrou.

Hodnoty:

tru
áno
fls
nie

License (Lice)

  • Druh licencie podľa možného využitia dokumentu uvedeného v licenčnej zmluve v súlade s autorským zákonom (licencia 1 – 4). Vypĺňa sa už v archíve.

Lang (Lang)

  • Jazyk diela, označuje kód jazyka textu v banke podľa normy ISO 639-3. V našom prípade bude jazykom vždy slovenčina.

Origlang (OrgL)

  • Pôvodný jazyk diela podľa ISO 639-3, ak ide o preklad. Preklady z prekladov zapisujeme cez znak „>“. Príklad: eng>ger.