Original title:
Získávání znalostí z datových skladů
Translated title:
Knowledge Discovery over Data Warehouses
Authors:
Pumprla, Ondřej ; Chmelař, Petr (referee) ; Stryka, Lukáš (advisor) Document type: Master’s theses
Year:
2009
Language:
cze Publisher:
Vysoké učení technické v Brně. Fakulta informačních technologií Abstract:
[cze][eng]
Diplomová práce se zabývá principy procesu získávání znalostí se zaměřením na asociační pravidla. Je vybudován teoretický aparát obecného popisu a principů tvorby datových skladů. Na základě těchto teoretických poznatků je implementována aplikace pro získávání asociačních pravidel. Aplikace očekává data buď v transakční nebo multidimenzionální podobě ve schématu hvězdy. Implementované algoritmy na hledání frekventovaných množin jsou Apriori a FP-strom. Systém umožňuje variantní nastavení parametrů dolování a byly provedeny ověřovací výkonnostní testy. Z pohledu podpory hledání asociačních pravidel se výsledná aplikace jeví robustnější než existující porovnávané systémy SAS a Oracle Data Miner.
This Master's thesis deals with the principles of the data mining process, especially with the mining of association rules. The theoretical apparatus of general description and principles of the data warehouse creation is set. On the basis of this theoretical knowledge, the application for the association rules mining is implemented. The application requires the data in the transactional form or the multidimensional data organized in the Star schema. The implemented algorithms for finding of the frequent patterns are Apriori and FP-tree. The system allows the variant setting of parameters for mining process. Also, the validation tests and efficiency proofs were accomplished. From the point of view of the association rules searching support, the resultant application is more applicable and robust than the existing compared systems SAS Miner and Oracle Data Miner.
Keywords:
Apriori; Association rules; Data mining; Data Warehouse; ETL; FP-tree; Frequent Patterns; Knowledge discovery; Multidimensional model; OLAP; Oracle Warehouse Builder 11 g; Star schema; Apriori; Asociační pravidla; Datové schéma hvězdy; Datový sklad; Dolování dat; ETL proces; FP-strom; Frekventované množiny; Multidimenzionální model; OLAP; Oracle Warehouse Builder 11 g; Získávání znalostí
Institution: Brno University of Technology
(web)
Document availability information: Fulltext is available in the Brno University of Technology Digital Library. Original record: http://hdl.handle.net/11012/53858