Štruktúrne značky používané v Historickom korpuse slovenčiny

Verzia hist-6.0 a verzia-7.0 využíva nasledujúce štruktúrne značky:

Štruktúrna značkaHodnotaVysvetleniePríkladPoznámka
<noise>Ruptúrny textInformácia o ťažko čitateľnom rekonštruovanom texte.<noise> ar … + Adonay </noise> 
Vynechaný textText mohol byť vynechaný z viacerých dôvodov, napr. v prípade dlhšieho zle čitateľného textu či pri dlhšom cudzojazyčnom úseku a pod.<de></de>Vynechaný text v nemčine. Značka „…“ predstavuje jeden znak, nie 3 samostatné bodky.
/Rozdelenie slovaPri výskyte dvoch a viacerých slov zapísaných dovedna lomka predstavuje delenie spojených slov na tokeny podľa súčasnej ortografie. s/nim, z/nassich, na/hlawu 
Spájanie slovPri výskyte rozdeleného slova (v rámci jedného riadku, nie však na konci riadku), ktoré by sa podľa súčasnej ortografie zapísalo dovedna, ligatúra predstavuje informáciu o mieste, kde bolo slovo prerušené. Takéto slovo je vyhľadávané ako jeden token bez prerušenia. ssetko oči‿sti; Žensku nemoc Pry‿ly‿ssneho toku zastawugeUvedené rozdelené slová sa vyhľadávajú v oboch tvaroch: Prylyssneho aj Prylyssneho
<miss>Text zachovaný len v prepise.Niektoré strany sa zachovali len v prepise uloženom v Oddelení dejín slovenčiny, onomastiky a etymológie JÚĽŠ SAV, chýbal však originál (resp. fotokópia originálu). V takom prípade je daná strana označená ako „chýbajúca“. <miss>… Koho hlawa boli War mrtwu žihlawu w/wine/aneb w wode a/uwaž sy na hlawu Proti čerweneg nemocy . Hales vtluč na/prach a pi w palenem . </miss> 
[]Rozpísanie skratkyVybrané skratky sú rozpísané pomocou hranatých zátvoriek, pričom rekonštruovaná/rozpísaná časť skratky je uvedená v zátvorke.u Ge[ho] M[i]l[o]stjV pôvodnom zápise nachádzame skrátený zápis: u Ge Mlstj
|Slovo s dvomi možnými čítaniamiV prípade, že nejasné slovo umožňuje dve čítania, zvislá čiara oddeľuje dva možné varianty daného slova. tzytedlnost|czytedlnost 

Na označenie cudzieho jazyka boli využívané nasledujúce značky:

Štruktúrna značkaVysvetleniePríklad
<la>latinčina<la> Anno 1660 in mense o[cto]bri[s] . </la>
<de>nemčina<de> Wildfeuer </de> to gest djwy ohen
<hu>maďarčina<hu> SZLOVÁK HERBÁRIUM </hu>
<he>hebrejčina <he> Adonay </he>
<el>gréčtina<el> Tetragramaton </el>
<frg>neznámy jazyk alebo prelínanie viacerých jazykov<frg> Jchmachataton </frg>

hist-5.0 boli popri vyššie uvedeným značkám používané aj ďalšie značky na označenie jazyka a skratiek:

Štruktúrna značkaSkratkaHodnotaVysvetleniePríkladPoznámka
remark<rem>lang=“la/de/hu/he/el/frg“Informácia o jazyku príslušného tokenu/tokenov, ktorý/é <rem> označuje<rem lang=“la“>Item</rem>Text v latinčine
remark<rem>abb=“…“Rozpísanie skratky<rem abb=“et cetera“>etc.</rem>