Original title:
Reálná úloha dobývání znalostí
Translated title:
Actual role of knowledge discovery in databases
Authors:
Pešek, Jiří ; Berka, Petr (advisor) ; Máša, Petr (referee) Document type: Master’s theses
Year:
2012
Language:
cze Publisher:
Vysoká škola ekonomická v Praze Abstract:
[cze][eng] Diplomová práce "Reálná úloha dobývání znalostí" se ve své praktické části zabývá predikcí odchodu zákazníků mobilního operátora. Úloha je řešena nad reálnými daty telekomunikační společnosti a pokrývá všechny kroky procesu dobývání znalostí. V souladu s metodikou CRISP-DM práce detailně rozebírá tyto fáze: porozumění problematice, porozumění datům, příprava dat, modelování, vyhodnocení výsledků a využití výsledků. Coby systém pro dobývání znalostí byl zvolen nástroj IBM SPSS Modeler. V úvodní kapitole teoretické části se čtenář seznámí s problematikou tzv. churn managementu, do níž spadá řešená úloha, nechybí zde vymezení základních pojmů v rámci data miningu. Pozornost je věnována rovněž základním typům úloh dobývání znalostí a algoritmům, které jsou relevantní ke zvolené úloze (rozhodovací stromy, regrese, neuronové sítě, bayesovské sítě a SVM). Samostatnou kapitolu tvoří metodiky popisující jednotlivé fáze procesu dobývání znalostí, přičemž větší prostor je věnován metodice CRISP-DM, z níž se vycházelo při řešení praktické úlohy. V závěru teoretické části jsou zmíněny komerční i volně dostupné systémy pro dobývání znalostí.The thesis "Actual role of knowledge discovery in databases˝ is concerned with churn prediction in mobile telecommunications. The issue is based on real data of a telecommunication company and it covers all steps of data mining process. In accord with the methodology CRISP-DM, the work looks thouroughly at the following stages: business understanding, data understanding, data preparation, modeling, evaluation and deployment. As far as a system for knowledge discovery in databases is concerned, the tool IBM SPSS Modeler was selected. The introductory chapter of the theoretical part familiarises the reader with the issue of so called churn management, which comprises the given assignment; the basic concepts related to data mining are defined in the chapter as well. The attention is also given to the basic types of tasks of knowledge discovery of databasis and algorithms that are pertinent to the selected assignment (decision trees, regression, neural network, bayesian network and SVM). The methodology describing phases of knowledge discovery in databases is included in a separate chapter, wherein the methodology of CRIPS-DM is examined in greater detail, since it represents the foundation for the solution of our practical assignment. The conclusion of the theoretical part also observes comercial or freely available systems for knowledge discovery in databases.
Keywords:
churn management; churn prediction; CRISP-DM; data mining; knowledge discovery in databases; churn management; CRISP-DM; data mining; dobývání znalostí z databází; predikce odchodu zákazníků
Institution: University of Economics, Prague
(web)
Document availability information: Available in the digital repository of the University of Economics, Prague. Original record: http://www.vse.cz/vskp/eid/31559