DocxToXml

aktuální verze: 0.6.0; autoři: Jiří Poláček, Boris Lehečka, Ondřej Svoboda; podpora: vokabular@ujc.cas.cz.

Program slouží k převodu dokumentů ve formátu DOCX na formát XML. Při konverzi se využívají zejména odstavcové a znakové styly použité ve vstupních dokumentech. Podobu výsledného dokumentu lze ovlivnit pomocí tzv. transformačních pravidel popsaných ve formátu XML, případně následnou transformací pomocí XSLT. Aplikace využívá platformu .NET Core 3.1 a funguje v operačních systémech Windows, Linux a macOS.

current version: 0.6.0; authors: Jiří Poláček, Boris Lehečka, Ondřej Svoboda; support: vokabular@ujc.cas.cz

This program converts DOCX files to XML, utilising mainly paragraph and character styles used in input documents. The output can be controlled with “transformation rules” described in XML or transformed afterwards using XSLT. The application is built on .NET Core 3.1 and works on Windows, Linux, and macOS.

Vývoj aplikace byl podpořen projektem Ministerstva školství, mládeže a tělovýchovy č. LM2015081 Výzkumná infrastruktura pro diachronní bohemistiku (RIDICS, https://vokabular.ujc.cas.cz) v rámci Projektu velkých infrastruktur pro VaVaI.
 
logo ÚJČCopyright © 2006–2022, oddělení vývoje jazyka, Ústav pro jazyk český AV ČR, v. v. i.
Vyhledávací program © 2006–2022, Boris Lehečka; Grafický návrh © 2006–2022, Irena Fuková

Vokabulář byl spuštěn před 15 lety, 6 měsíci a 6 dny; verze dat: 1.1.21
Ministerstvo školství, mládeže a tělovýchovyStrategie AV21
Web byl podpořen Ministerstvem školství, mládeže a tělovýchovy ČR, projekty č. LM2018101
(LINDAT/CLARIAH-CZ) a LM2015081 (RIDICS).