Original title:
Možnosti přímého zpracování formátů ODF/OOXML v XSLT
Translated title:
The possibility of direct ODF/OOXML format processing in XSLT
Authors:
Sem, Štěpán ; Kosek, Jiří (advisor) ; Nálevka, Petr (referee) Document type: Bachelor's theses
Year:
2008
Language:
cze Publisher:
Vysoká škola ekonomická v Praze Abstract:
[cze][eng] Cílem této práce je umožnit pracovat a archivy XML dokumentů a souvisejících dat přímo pomocí XML nástrojů, například XSLT procesorů. Zejména se jedná o zpracování ODF a OOXML formátů. Celý archiv bude reprezentován jediným XML dokumentem, který bude přímo obsahovat XML dokumenty z vnitřku archivu a případně binární data překódovaná do base64. Reprezentace bude vytvářena parserem implementovaným v programovacím jazyce Java. První kapitola popisuje příklad, jak mohou být data uvnitř archivu uložena. Je důležité si uvědomit, že po dekompresi archivu získáme převážně XML dokumenty, ve kterých je uložena převážná část informačního obsahu dokumentu a můžeme je tudíž přímo zpracovat. Ve druhé kapitole si nejprve popíšeme jednotlivá rozhraní parserů, která umožňují snadněji pracovat s XML dokumenty. Tyto informace úzce souvisí s hlavní náplní práce -- implementací parseru. Po stručném seznámení s existujícími možnostmi zpracování dokumentů si ukážeme na doprovodném příkladě jak by vypadalo řešení v aplikaci používající parser implementující konkrétní rozhraní a zdůvodníme řešení zvolené v této práci. Třetí kapitola rozebírá možnosti reprezentace ZIP archivu jako XML souboru a volbu nejvhodnější reprezentace pro tuto aplikaci. Zmíníme též možnosti řešení situací kdy dokument obsahuje odkazy na jiné dokumenty. Cílem čtvrté kapitoly je podat stručný výklad o prostředcích poskytovaných jazykem Java, které se vážou k vlastnímu řešení a popsat konkrétní řešení problému. Pátá kapitola si potom klade za cíl demonstrovat použití vytvořené aplikace.The aim of this thesis is to allow to work with XML document archives and related data directly by the help of XML tools, e.g. XSLT processors. It is particularly about ODF and OOXML format processing. The whole archive will be represented by only one XML document, which will directly include XML documents from the inside of the archive and base64 encoded binary data eventually. The representation will be created by the parser implemented in Java programming language. The first chapter describes an example of how the data can be stored inside the archive. It is necessary to realize, that after the archive decompression, we will get mainly XML documents, in which the prevailing part of the document's content is stored and that we can therefore directly process. First of all in the second chapter, we will describe various parser interfaces, which allow to work with the XML documents more easily. This information is closely related to the main scope of the thesis - parser implementation. After the brief identification with the existing possibilities of document processing, we will demonstrate the solution in the application using a concrete interface implementing parser on an accompanying example and we will give reasons for the solution chosen in this thesis. The third chapter analyses possibilities of an ZIP archive representation as an XML file and selection of the most suitable one for this application. We will also mention the possible solutions of situations, when the document contains links to another documents. The aim of the fourth chapter is to briefly construe the Java provided facilities, which relate to the solution itself, and to describe the concrete solution to the problem. The fifth chapter aims to demonstrate the usage of the created application.
Keywords:
SAX; XSLT; ZIP; SAX; XSLT; ZIP
Institution: University of Economics, Prague
(web)
Document availability information: Available in the digital repository of the University of Economics, Prague. Original record: http://www.vse.cz/vskp/eid/13819