Název:
Reálná úloha dobývání znalostí
Překlad názvu:
Actual role of knowledge discovery in databases
Autoři:
Pešek, Jiří ; Berka, Petr (vedoucí práce) ; Máša, Petr (oponent) Typ dokumentu: Diplomové práce
Rok:
2012
Jazyk:
cze
Nakladatel: Vysoká škola ekonomická v Praze
Abstrakt: [cze][eng] Diplomová práce "Reálná úloha dobývání znalostí" se ve své praktické části zabývá predikcí odchodu zákazníků mobilního operátora. Úloha je řešena nad reálnými daty telekomunikační společnosti a pokrývá všechny kroky procesu dobývání znalostí. V souladu s metodikou CRISP-DM práce detailně rozebírá tyto fáze: porozumění problematice, porozumění datům, příprava dat, modelování, vyhodnocení výsledků a využití výsledků. Coby systém pro dobývání znalostí byl zvolen nástroj IBM SPSS Modeler. V úvodní kapitole teoretické části se čtenář seznámí s problematikou tzv. churn managementu, do níž spadá řešená úloha, nechybí zde vymezení základních pojmů v rámci data miningu. Pozornost je věnována rovněž základním typům úloh dobývání znalostí a algoritmům, které jsou relevantní ke zvolené úloze (rozhodovací stromy, regrese, neuronové sítě, bayesovské sítě a SVM). Samostatnou kapitolu tvoří metodiky popisující jednotlivé fáze procesu dobývání znalostí, přičemž větší prostor je věnován metodice CRISP-DM, z níž se vycházelo při řešení praktické úlohy. V závěru teoretické části jsou zmíněny komerční i volně dostupné systémy pro dobývání znalostí.The thesis "Actual role of knowledge discovery in databases˝ is concerned with churn prediction in mobile telecommunications. The issue is based on real data of a telecommunication company and it covers all steps of data mining process. In accord with the methodology CRISP-DM, the work looks thouroughly at the following stages: business understanding, data understanding, data preparation, modeling, evaluation and deployment. As far as a system for knowledge discovery in databases is concerned, the tool IBM SPSS Modeler was selected. The introductory chapter of the theoretical part familiarises the reader with the issue of so called churn management, which comprises the given assignment; the basic concepts related to data mining are defined in the chapter as well. The attention is also given to the basic types of tasks of knowledge discovery of databasis and algorithms that are pertinent to the selected assignment (decision trees, regression, neural network, bayesian network and SVM). The methodology describing phases of knowledge discovery in databases is included in a separate chapter, wherein the methodology of CRIPS-DM is examined in greater detail, since it represents the foundation for the solution of our practical assignment. The conclusion of the theoretical part also observes comercial or freely available systems for knowledge discovery in databases.
Klíčová slova:
churn management; CRISP-DM; data mining; dobývání znalostí z databází; predikce odchodu zákazníků; churn management; churn prediction; CRISP-DM; data mining; knowledge discovery in databases
Instituce: Vysoká škola ekonomická v Praze
(web)
Informace o dostupnosti dokumentu:
Dostupné v digitálním repozitáři VŠE. Původní záznam: http://www.vse.cz/vskp/eid/31559