Original title:
Možnosti prezentace výsledků DZD na webu
Translated title:
Options of presentation of KDD results on Web
Authors:
Koválik, Tomáš ; Rauch, Jan (advisor) ; Šimůnek, Milan (referee) Document type: Master’s theses
Year:
2015
Language:
cze Publisher:
Vysoká škola ekonomická v Praze Abstract:
[cze][eng] Diplomová práce se zabývá DZD analýzou dat a způsoby prezentace výsledků DZD na webu. Práce je členěna do tří hlavních částí, které na sebe navazují a kopírují průběh celé práce. První část práce obsahuje teoretický základ, potřebný pro pochopení probírané problematiky. Je zde popsána metodika CRISP-DM, jsou zde definovány pojmy matice dat a doménové znalosti, je zde představena metoda GUHA, systém LISp-Miner a implementace metody GUHA v systému LISp-Miner včetně popis pro tuto práci stěžejních procedur 4ft-Miner a CF-Miner. Druhá část práce je zaměřená na zpracování prvního cíle práce. Stručně se věnuje popisu provedené preanalýzy a následně je zde popsán postup během analýzy doménových znalostí ve vybrané datové sadě. V třetí části práce je následně řešen druhý cíl práce, problém prezentace výsledků DZD na webu. Třetí část práce obsahuje stručný teoretický základ k vybraným technologiím. Následně je zde popsána práce při tvorbě automatického exportu výsledků DZD do formátu HTML včetně struktury výstupu a doporučení pro práci se systémem LISp-Miner.This diploma thesis covers KDD analysis of data and options of presentation of KDD results on Web. The paper is divided into three main sections, which follow the whole process of this thesis. In the first section are mentioned theoretical basics needed for understanding of discussed problem. In this section are described notions data matrix and domain knowledge, concept of CRISP-DM methodology, GUHA method, system LISp-Miner and implementation of GUHA method in LISp-Miner including description of core procedures 4ft-Miner and CF-Miner. The second section is dedicated to the first goal of this paper. It briefly summarizes analysis made during pre-analysis phase. Then is described process of analysis of domain knowledge in a given data set. The third part focuses on the second goal of this thesis, which is problem of presentation of KDD results on Web. This section covers brief theoretical basis for used technologies. Then is described development of export script for automatic generation of website from results found using LISp-Miner system including description of structure of the output and recommendations for work in LISp-Miner system.
Keywords:
4ft-Miner; association rules; CF-Miner; Chicago; crimes; CRISP-DM; domain knowledge; export; GUHA; Highcharts; HTML; KDD; LISp-Miner; LM Exec; LMCL; 4ft-Miner; Asociační pravidla; CF-Miner; Chicago; CRISP-DM; doménové znalosti; DZD; export; GUHA; Highcharts; HTML; kriminální činy; LISp-Miner; LM Exec; LMCL
Institution: University of Economics, Prague
(web)
Document availability information: Available in the digital repository of the University of Economics, Prague. Original record: http://www.vse.cz/vskp/eid/48621