Středněčeská textová banka

     Středněčeská textová banka vzniká v rámci textologické a ediční činnosti oddělení vývoje jazyka. Zveřejňujeme ji prozatím v testovacím provozu a tvoří z časového hlediska logický doplněk ke staročeské textové bance. Ovládání je u obou zdrojů totožné (srov. níže). V současné době banka obsahuje jen nevelké množství textů, z nichž některé již byly zveřejněny v rámci edičního modulu Vokabuláře webového. Domníváme se však, že i malé množství textů ze středněčeského období může badatelům a zájemcům posloužit. Postupně budeme do obou zdrojů, tj. do edičního modulu a středněčeské textové banky, začleňovat další edice, které na pracovišti oddělení vývoje jazyka připravíme.

     Banka zahrnuje texty zhruba z období od roku 1500 do konce 18. století. Zřídka obsahuje texty mladší, a to v těch případech, kdy text je opisem starších památek. Texty jsou do banky zařazovány výhradně v transkripci do novočeského pravopisu. Uživateli je zpřístupňujeme prostřednictvím korpusového manažeru, jehož autorem je dr. Pavel Květoň, Ph.D. Přehledný návod k užívání manažeru je obsažen přímo v aplikaci (viz tlačítko „Jak hledat“). Protože je středněčeská textová banka postupně doplňována, upravována a opravována, je při citaci jejích dat nezbytné uvádět verzi banky (datum), která je uvedena v nabídkovém menu korpusového manažeru.

     Zařazené texty prošly při transkripci podrobnou lingvistickou analýzou, proto je lze prezentovat s doprovodnými informacemi, a to alespoň v té míře, jakou webová prezentace dovolí. Tyto informace se týkají pramenného textu jako artefaktu a charakteristiky jazyka, jímž je pramen zaznamenán.

     Informace o prameni je uživatelům zprostředkována dvojím způsobem: jednak v seznamu začleněných textů, jednak – stručněji – přímo v korpusovém manažeru. Každý text obsahuje informaci o charakteru pramene, z něhož byl pořízen (rukopis, starý tisk, novodobá edice). Novodobou edici používáme jako pramen jen ve výjimečných případech: když originální pramen není dostupný, případně když je dostupný jen velmi obtížně. U zdrojového pramene je dále uvedeno jeho dochování (uložení v instituci, signatura, datace pramene, rozsah stran). Tyto obecné informace v seznamu textů začleněných do banky ještě doplňujeme o jméno autora elektronické edice a o datum, kdy byl text do banky zapojen.

     Přímo ve středněčeské textové bance zpřístupněné korpusovým manažerem si může uživatel zobrazit volbou z nabídky „Možnosti zobrazení“ různé charakteristiky textu. Při zvolení možnosti „Komentář“ se ve stručné formě zobrazují komentáře editora. Jedná se především o emendační zásahy (v pozici za lomítkem je v transliteraci znění pramenného textu, které editor v transkripci změnil). V téže pozici se mohou vyskytovat poznámky editora o tom, že výraz je v transkribovaném textu editorem doplněn („doplněno“) nebo že výraz je zapsán či zachován nekompletní a že jej nejde bez pochybností rekonstruovat formou emendace („torzovité slovo“).

     Při zvolení možnosti „Jazyk“ se u příslušného výrazu zobrazí informace o tom, že slovo nepatří do české slovní zásoby („cizí slovo“).

     Důležitý je rovněž údaj o tom, v které části textu se nalezený výraz nachází, tj. informace o lokaci. Stručnou informaci o lokaci přináší u vybraného výsledku hledání dolní část obrazovky; podrobnou lokaci si uživatel zobrazí volbou „Struktura textu“. Vesměs je uváděna uzuální foliace či paginace, u veršovaných textů jsou většinou číslovány také verše. U novodobých edic je uvedeno stránkování podle edice, přičemž se snažíme dodávat i stránkování podle originálu. V textech jsou dále značeny jednotlivé části textu, tj. titul, nadpis, podnadpis, přípisky k textu. – Při vyhledání zadaného řetězce se nalezené výsledky řadí chronologicky podle stáří pramene (nikoliv památky!).

     Hledání v textové bance rovněž umožňuje při zadávání dotazu rozlišovat velká či malá písmena (tato možnost je nastavena ve vyhledávání jako základní – viz nabídka „Rozlišovat velikost písmen“). Rovněž lze nastavit šíři kontextu vyhledaného výrazu (v rozsahu 10, 20, 50 či 100 pozic vpravo i vlevo).

     Výsledek hledání je možné si dle potřeby archivovat ve formě prostého textu (pomocí tlačítka „Uložit“).

     2. února 2015

Alena M. Černá

     Seznam začleněných textů

logo ÚJČCopyright © 2006–2016, oddělení vývoje jazyka, Ústav pro jazyk český AV ČR, v. v. i.
Vyhledávací program © 2006–2016, Boris Lehečka; Grafický návrh © 2006–2016, Irena Fuková

Vokabulář byl spuštěn před 10 lety, 5 měsíci a 9 dny; verze dat: 1.1.1
Ministerstvo školství, mládeže a tělovýchovy
Web je podpořen projektem Ministerstva školství, mládeže a tělovýchovy č. LM2015081
„Výzkumná infrastruktura pro diachronní bohemistiku“ (akronym RIDICS) v rámci Projektu velkých infrastruktur pro VaVaI.