Original title:
Podpora extrakce informací ze strukturovaného textu
Translated title:
Support of Information Extraction from Structured Text
Authors:
Kliment, Radek ; Petřík, Patrik (referee) ; Křivka, Zbyněk (advisor) Document type: Bachelor's theses
Year:
2010
Language:
cze Publisher:
Vysoké učení technické v Brně. Fakulta informačních technologií Abstract:
[cze][eng]
Tato bakalářská práce se zabývá způsobem extrakce informací ze strukturovaných textů. Výsledná aplikace provede převod textů podporovaných formátů na XML reprezentaci, nad kterou jsou následně prováděny dotazy, pomocí nichž je vytvořen odpovídající výstup. V práci jsou popsány jednotlivé vstupní formáty, způsob jejich převodu na XML, dále návrh a implementace aplikace, včetně stručného návodu k ovládání.
This Bachelor thesis deals with the way of information extraction from a structured text. The application converts the text from supported formats into the XML representation that is used for queries and then, corresponding output is created. In this thesis, particular formats of input files are described including the way of their conversion into the XML. The essential part explains the application functionality and implementation including short user manual.
Keywords:
CSV; information extraction; INI; JSON; XML; XQuery; CSV; extrakce informací; INI; JSON; XML; XQuery
Institution: Brno University of Technology
(web)
Document availability information: Fulltext is available in the Brno University of Technology Digital Library. Original record: http://hdl.handle.net/11012/55982