Název:
Porovnatelnost dat v dobývání znalostí z databází
Překlad názvu:
Data comparability in knowledge discovery in databases
Autoři:
Horáková, Linda ; Chudán, David (vedoucí práce) ; Svátek, Vojtěch (oponent) Typ dokumentu: Diplomové práce
Rok:
2017
Jazyk:
cze
Nakladatel: Vysoká škola ekonomická v Praze
Abstrakt: [cze][eng] Diplomová práce se zabývá analýzou porovnatelnosti a souměřitelnosti dat v datových souborech, nad kterými jsou prováděny úlohy dobývání znalostí z databází. Porovnatelnost dat je jedním z aspektů datové kvality, která je kritická pro získání správných a využitelných výsledků získaných metodami dolování dat. Teoretická část se věnuje obecným principům datové kvality, porovnatelnosti a souměřitelnosti dat, a také procesu dobývání znalostí z databází a specifickým aspektům dolování agregovaných dat. Tyto poznatky jsou následně aplikovány v praktické části diplomové práce, jejímž cílem je navrhnout obecnou metodologii, která slouží k rozeznání potenciálních problémů v porovnatelnosti dat v rámci datového souboru. Tato metodologie vznikla na základě analýzy reálného souboru dat, obsahujícího údaje o prodejích. Následně je metodologie aplikována na údaje z oblasti veřejných rozpočtů, konkrétně na data z Evropského sociálního fondu.The master thesis is focused on analysis of data comparability and commensurability in datasets, which are used for obtaining knowledge using methods of data mining. Data comparability is one of aspects of data quality, which is crucial for correct and applicable results from data mining tasks. The aim of the theoretical part of the thesis is to briefly describe the field of knowledqe discovery and define specifics of mining of aggregated data. Moreover, the terms of comparability and commensurability is discussed. The main part is focused on process of knowledge discovery. These findings are applied in practical part of the thesis. The main goal of this part is to define general methodology, which can be used for discovery of potential problems of data comparability in analyzed data. This methodology is based on analysis of real dataset containing daily sales of products. In conclusion, the methodology is applied on data from the field of public budgets.
Klíčová slova:
asociační pravidla; dobývání znalostí z databází; dolování dat; kvalita dat; porovnatelnost; souměřitelnost; association rules; commensurability; data comparability; data mining; data quality; Knowledge Discovery in Databases
Instituce: Vysoká škola ekonomická v Praze
(web)
Informace o dostupnosti dokumentu:
Dostupné v digitálním repozitáři VŠE. Původní záznam: http://www.vse.cz/vskp/eid/68636