Original title:
Využití XML databází pro zpřístupnění specifikací úloh dobývání znalostí z databází
Translated title:
Utilization of XML databases for retrieval of data-mining specifications
Authors:
Marek, Tomáš ; Kliegr, Tomáš (advisor) ; Kosek, Jiří (referee) Document type: Bachelor's theses
Year:
2009
Language:
cze Publisher:
Vysoká škola ekonomická v Praze Abstract:
[cze][eng] Cílem této práce je vytvořit systém dotazování ve vytvořených analytických zprávách uložených jako PMML dokumenty. Tyto PMML dokumenty jsou uloženy v nativní XML databázi, protože se jedná o strukturované dokumenty, které využívají prostředky XML. Vybraná XML databáze je k dispozici zdarma a její prostředky a možnosti vyhovují navrženému řešení. Dále byl vytvořen algoritmus pro vyhledávání v těchto dokumentech pomocí prostředků jazyka XQuery. Vzhledem k tomu, že prohledávaná data mají charakter XML dat nabízí se právě využití jazyka pro dotazování v XML datech. V rámci využití XQuery jazyka bylo třeba prozkoumat strukturu PMML dokumentů a využít různá propojení dat v těchto dokumentech pro zajištění správných výsledků vyhledávání. Výsledkem vyhledávání jsou asociační pravidla z těchto analytických zpráv uložených v PMML dokumentech, požadavkem vyhledávání jsou atributy, které se mají v pravidlech objevovat, jejich hodnoty a další omezení vyhledávání. Aby celý systém byl kompletní a mohl být plně využíván, je třeba vytvořit komunikační prostředí, pomocí kterého práce s uloženými daty probíhá. Pro tento účel jsou využity prostředky jazyka Java a architektura REST(ful) pro tvorbu aplikací.The aim of this work is to create a querying system in analytical reports stored as PMML documents. These PMML documents are stored in native XML database, because these documents are structured as XML documents. Selected XML database is available for free and its resources and means meet the proposed solution. Also searching algorithm is created to search these documents by means of XQuery language. Inasmuch as searched data have the character of the XML data the use of language for querying XML data suggests. In terms of the use of the XQuery language structure of PMML document was explored and data links in these documents was used to ensure proper search results. Results of the search are association rules from these analytical reports stored in PMML documents, requests of the search are attributes to be in the rules, their values and other limits of the search. So that the whole system is complete and could be fully used, it is necessary to create a communication environment through which the work with stored data is performed. For this purpose, Java and REST(ful) architecture for creating applications are used.
Keywords:
API; data mining; PMML; XML database; XQuery; API; data mining; databáze; PMML; XML; XQuery
Institution: University of Economics, Prague
(web)
Document availability information: Available in the digital repository of the University of Economics, Prague. Original record: http://www.vse.cz/vskp/eid/21943