Original title:
OLAP Recommender: Supporting Navigation in Data Cubes Using Association Rule Mining
Translated title:
OLAP Recommender
Authors:
Koukal, Bohuslav ; Chudán, David (advisor) ; Vojíř, Stanislav (referee) Document type: Master’s theses
Year:
2017
Language:
eng Publisher:
Vysoká škola ekonomická v Praze Abstract:
[eng][cze] Manual data exploration in data cubes and searching for potentially interesting and useful information starts to be time-consuming and ineffective from certain volume of the data. In my thesis, I designed, implemented and tested a system, automating the data cube exploration and offering potentially interesting views on OLAP data to the end user. The system is based on integration of two data analytics methods - OLAP analysis data visualisation and data mining, represented by GUHA association rules mining. Another contribution of my work is a research of possibilities how to solve differences between OLAP analysis and association rule mining. Implemented solutions of the differences include data discretization, dimensions commensurability, design of automatic data mining task algorithm based on the data structure and mapping definition between mined association rules and corresponding OLAP visualisation. The system was tested with real retail sales data and with EU structural funds data. The experiments proved that complementary usage of the association rule mining together with OLAP analysis identifies relationships in the data with higher success rate than the isolated use of both techniques.Manuální prozkoumávání agregovaných dat v datových kostkách a vyhledávání potenciálně užitečných informací je od určitého objemu dat časově náročné a neefektivní. V této práci jsem navrhnul, implementoval a na reálných datech otestoval systém, který prohledávání datové kostky automatizuje a nabízí uživateli potenciálně zajímavé pohledy na OLAP kostku. Systém je založen na propojení dvou metod datové analýzy - vizualizaci dat v OLAP analýze a dobývání znalostí z dat, reprezentovaném GUHA asociačními pravidly. Dalším přínosem práce je výzkum možností řešení rozdílů mezi OLAP analýzou a dolováním asociačních pravidel. Mezi implementačně řešené rozdíly patří především diskretizace dat, problém souměřitelnosti dimenzí, návrh automatického nastavení algoritmu pro dolování na základě struktury dat a definice provázání asociačních pravidel s OLAP vizualizací. Nástroj byl testován s reálnými maloobchodními prodejními daty a s daty o strukturálních fondech EU. Testování prokázalo, že propojení metod dolování asociačních pravidel a OLAP analýzy dokáže identifikovat zajímavé vztahy v datech s vyšší úspěšností než použití těchto metod samostatně.
Keywords:
association rules; data cube; data mining; GUHA; mining aggregate data; OLAP analysis; OLAP navigation; OLAP Recommender; OLAP visualisation; recommender system; asociační pravidla; datová kostka; doporučovací systém; GUHA; navigace v OLAP; OLAP analýza; OLAP Recommender; OLAP vizualizace; vytěžování dat
Institution: University of Economics, Prague
(web)
Document availability information: Available in the digital repository of the University of Economics, Prague. Original record: http://www.vse.cz/vskp/eid/68597