Staročeská textová banka

     Staročeská textová banka vzniká v rámci textologické a ediční činnosti oddělení vývoje jazyka. Cíleně je budována od roku 2006, odkdy jsou staročeské texty, jejichž transkribované edice v oddělení vznikají, formálně upravovány rovněž s ohledem na zpřístupnění textové banky prostřednictvím internetové aplikace Vokabulář webový.

     Banka zahrnuje texty z období od nejstarších počátků historické češtiny přibližně do konce 15. století. Zřídka obsahuje texty mladší, z prvních desetiletí 16. století – a to v těch případech, kdy lze předpokládat, že text vznikl ve starším období. Texty jsou do banky zařazovány výhradně v transkripci do novočeského pravopisu. Uživateli je zpřístupňujeme prostřednictvím korpusového manažeru, jehož autorem je dr. Pavel Květoň, Ph.D. Přehledný návod k užívání manažeru je obsažen přímo v aplikaci (viz tlačítko „Jak hledat“). Protože je staročeská textová banka postupně doplňována, upravována a opravována, je nezbytné při citaci jejích dat uvádět verzi banky (datum), která je uvedena v nabídkovém menu korpusového manažeru.

     Zařazené texty prošly při transkripci podrobnou lingvistickou analýzou, proto je lze prezentovat s doprovodnými informacemi, a to alespoň v té míře, jakou webová prezentace dovolí. Tyto informace se týkají pramenného textu jako artefaktu a charakteristiky jazyka, jímž je pramen zaznamenán.

     Informace o prameni je uživatelům zprostředkována dvojím způsobem: jednak v seznamu začleněných textů, jednak – stručněji – přímo v korpusovém manažeru. Každý text obsahuje informaci o charakteru pramene, z něhož byl pořízen (rukopis, prvotisk, starý tisk, novodobá edice). Novodobou edici používáme jako pramen jen ve výjimečných případech: když originální pramen není dostupný, případně když je dostupný jen velmi obtížně. U zdrojového pramene je dále uvedeno jeho dochování (uložení v instituci, signatura, datace pramene, rozsah stran). Tyto obecné informace v seznamu textů začleněných do banky ještě doplňujeme o jméno autora elektronické edice a o datum, kdy byl text do banky zapojen.

     Přímo ve staročeské textové bance zpřístupněné korpusovým manažerem si může uživatel zobrazit volbou z nabídky „Možnosti zobrazení“ různé charakteristiky textu. Při zvolení možnosti „Komentář“ se ve stručné formě zobrazují komentáře editora. Jedná se především o emendační zásahy (v pozici za lomítkem je v transliteraci znění pramenného textu, které editor v transkripci změnil). V téže pozici se mohou vyskytovat poznámky editora o tom, že výraz je v transkribovaném textu editorem doplněn („doplněno“) nebo že výraz je zapsán či zachován nekompletní a že jej nejde bez pochybností rekonstruovat formou emendace („torzovité slovo“).

     Při zvolení možnosti „Jazyk“ se u příslušného výrazu zobrazí informace o tom, že slovo nepatří do české slovní zásoby („cizí slovo“).

     Důležitý je rovněž údaj o tom, v které části textu se nalezený výraz nachází, tj. informace o lokaci. Stručnou informaci o lokaci přináší u vybraného výsledku hledání dolní část obrazovky; podrobnou lokaci si uživatel zobrazí volbou „Struktura textu“. Vesměs je uváděna uzuální foliace či paginace, u veršovaných textů jsou většinou číslovány také verše. U novodobých edic je uvedeno stránkování podle edice, přičemž se snažíme dodávat i stránkování podle originálu. V textech jsou dále značeny jednotlivé části textu, tj. titul, nadpis, podnadpis, přípisky k textu. – Při vyhledání zadaného řetězce se nalezené výsledky řadí chronologicky podle stáří pramene (nikoliv památky!).

     Hledání v textové bance rovněž umožňuje při zadávání dotazu rozlišovat velká či malá písmena (tato možnost je nastavena ve vyhledávání jako základní – viz nabídka „Rozlišovat velikost písmen“). Rovněž lze nastavit šíři kontextu vyhledaného výrazu (v rozsahu 10, 20, 50 či 100 pozic vpravo i vlevo).

     Výsledek hledání je možné si dle potřeby archivovat ve formě prostého textu (pomocí tlačítka „Uložit“).

Zveřejnění Klaretových slovníků Vokabulář gramatický, Bohemář a Glosář

     Základem elektronických edic Klaretových latinsko-českých slovníků Vokabulář gramatický, Bohemář a Glosář byla naskenovaná knižní edice V. Flajšhanse Klaret a jeho družina. Sv. I. Slovníky veršované. Praha 1926. Naskenovaný text byl doplněn o transkribované znění staročeských výrazů v podobě, v jaké je uvádí slovník k uvedené edici. Dále bylo (za grafickou značkou ≈) doplněno možné různočtení; v „Komentáři“ je pak určeno, odkud bylo různočtení převzato. Vzhledem k interpretační obtížnosti Klaretových textů v „Komentáři“ uvádíme též transliterovanou podobu výrazů.

Alena M. Černá

     Seznam začleněných textů

logo ÚJČCopyright © 2006–2017, oddělení vývoje jazyka, Ústav pro jazyk český AV ČR, v. v. i.
Vyhledávací program © 2006–2017, Boris Lehečka; Grafický návrh © 2006–2017, Irena Fuková

Vokabulář byl spuštěn před 10 lety, 11 měsíci a 8 dny; verze dat: 1.1.3
Ministerstvo školství, mládeže a tělovýchovyStrategie AV21
Web je podpořen projektem Ministerstva školství, mládeže a tělovýchovy č. LM2015081
„Výzkumná infrastruktura pro diachronní bohemistiku“ (akronym RIDICS) v rámci Projektu velkých infrastruktur pro VaVaI.