Staročeská textová banka

Staročeská textová banka vzniká v rámci textologické a ediční činnosti oddělení vývoje jazyka. Cíleně je budována od roku 2006, odkdy jsou staročeské texty, jejichž transkribované edice v oddělení vznikají, formálně upravovány rovněž s ohledem na zpřístupnění textové banky prostřednictvím internetové aplikace Vokabulář webový.

Banka zahrnuje texty z období od nejstarších počátků historické češtiny přibližně do konce 15. století. Zřídka obsahuje texty mladší, z prvních desetiletí 16. století – a to v těch případech, kdy lze předpokládat, že text vznikl ve starším období. Texty jsou do banky zařazovány výhradně v transkripci do novočeského pravopisu. Uživateli je zpřístupňujeme prostřednictvím korpusového manažeru, jehož autorem je dr. Pavel Květoň, Ph.D. Přehledný návod k užívání manažeru je obsažen přímo v aplikaci (viz tlačítko „Jak hledat“). Protože je staročeská textová banka postupně doplňována, upravována a opravována, je nezbytné při citaci jejích dat uvádět verzi banky (datum), která je uvedena v nabídkovém menu korpusového manažeru.

Zařazené texty prošly při transkripci podrobnou lingvistickou analýzou, proto je lze prezentovat s doprovodnými informacemi, a to alespoň v té míře, jakou webová prezentace dovolí. Tyto informace se týkají pramenného textu jako artefaktu a charakteristiky jazyka, jímž je pramen zaznamenán.

Informace o prameni je uživatelům zprostředkována dvojím způsobem: jednak v seznamu začleněných textů, jednak – stručněji – přímo v korpusovém manažeru. Každý text obsahuje informaci o charakteru pramene, z něhož byl pořízen (rukopis, prvotisk, starý tisk, novodobá edice). Novodobou edici používáme jako pramen jen ve výjimečných případech: když originální pramen není dostupný, případně když je dostupný jen velmi obtížně. U zdrojového pramene je dále uvedeno jeho dochování (uložení v instituci, signatura, datace pramene, rozsah stran). Tyto obecné informace v seznamu textů začleněných do banky ještě doplňujeme o jméno autora elektronické edice a o datum, kdy byl text do banky zapojen.

Přímo ve staročeské textové bance zpřístupněné korpusovým manažerem si může uživatel zobrazit volbou z nabídky „Možnosti zobrazení“ různé charakteristiky textu. Při zvolení možnosti „Komentář“ se ve stručné formě zobrazují komentáře editora. Jedná se především o emendační zásahy (v pozici za lomítkem je v transliteraci znění pramenného textu, které editor v transkripci změnil). V téže pozici se mohou vyskytovat poznámky editora o tom, že výraz je v transkribovaném textu editorem doplněn („doplněno“) nebo že výraz je zapsán či zachován nekompletní a že jej nejde bez pochybností rekonstruovat formou emendace („torzovité slovo“).

Při zvolení možnosti „Jazyk“ se u příslušného výrazu zobrazí informace o tom, že slovo nepatří do české slovní zásoby („cizí slovo“).

Důležitý je rovněž údaj o tom, v které části textu se nalezený výraz nachází, tj. informace o lokaci. Stručnou informaci o lokaci přináší u vybraného výsledku hledání dolní část obrazovky; podrobnou lokaci si uživatel zobrazí volbou „Struktura textu“. Vesměs je uváděna uzuální foliace či paginace, u veršovaných textů jsou většinou číslovány také verše. U novodobých edic je uvedeno stránkování podle edice, přičemž se snažíme dodávat i stránkování podle originálu. V textech jsou dále značeny jednotlivé části textu, tj. titul, nadpis, podnadpis, přípisky k textu. – Při vyhledání zadaného řetězce se nalezené výsledky řadí chronologicky podle stáří pramene (nikoliv památky!).

Hledání v textové bance rovněž umožňuje při zadávání dotazu rozlišovat velká či malá písmena (tato možnost je nastavena ve vyhledávání jako základní – viz nabídka „Rozlišovat velikost písmen“). Rovněž lze nastavit šíři kontextu vyhledaného výrazu (v rozsahu 10, 20, 50 či 100 pozic vpravo i vlevo).

Výsledek hledání je možné si dle potřeby archivovat ve formě prostého textu (pomocí tlačítka „Uložit“).

Zveřejnění Klaretových slovníků Vokabulář gramatický, Bohemář a Glosář

Základem elektronických edic Klaretových latinsko-českých slovníků Vokabulář gramatický, Bohemář a Glosář byla naskenovaná knižní edice V. Flajšhanse Klaret a jeho družina. Sv. I. Slovníky veršované. Praha 1926. Naskenovaný text byl doplněn o transkribované znění staročeských výrazů v podobě, v jaké je uvádí slovník k uvedené edici. Dále bylo (za grafickou značkou ≈) doplněno možné různočtení; v „Komentáři“ je pak určeno, odkud bylo různočtení převzato. Vzhledem k interpretační obtížnosti Klaretových textů v „Komentáři“ uvádíme též transliterovanou podobu výrazů.

Poznámka k některým biblickým textům zapojeným do korpusové báze

U některých biblických textů nejsou zobrazeny informace o opravách textu (emendacích), neboť jejich přepisy byly připraveny primárně pro jiný způsob prezentace, než je korpusová aplikace. Doporučujeme proto ověřit přesné znění textu v edičním modulu. Jedná se o tyto biblické prameny: Bible drážďanská, Bible litoměřická, Bible padeřovská, Bible Bočkova, Bible mikulovská, Nový zákon muzejní mladší, Bible pražská.

Alena M. Černá

Seznam začleněných textů

logo ÚJČ Copyright © 2006–2023, oddělení vývoje jazyka, Ústav pro jazyk český AV ČR, v. v. i.
Vyhledávací program © 2006–2023, Boris Lehečka; Grafický návrh © 2006–2023, Irena Fuková

Vokabulář byl spuštěn před 17 lety, 5 měsíci a 2 dny; verze dat: 1.1.24
Ministerstvo školství, mládeže a tělovýchovy Strategie AV21
Web je podpořen Ministerstvem školství, mládeže a tělovýchovy ČR, projektem č. LM2023062
(LINDAT/CLARIAH-CZ).