Název:
Praktické uplatnění technologií data mining ve zdravotních pojišťovnách
Překlad názvu:
Practical applications of data mining technologies in health insurance companies
Autoři:
Kulhavý, Lukáš ; Pour, Jan (vedoucí práce) ; Kučera, Petr (oponent) Typ dokumentu: Diplomové práce
Rok:
2010
Jazyk:
cze
Nakladatel: Vysoká škola ekonomická v Praze
Abstrakt: [cze][eng] Tato diplomová práce se věnuje technologii data mining a možnostem jejího praktického využití v oblasti zdravotních pojišťoven. Práce vymezuje pojem data mining a jeho vztah k pojmu dobývání znalostí z databází. Pojem data mining je vysvětlen mimo jiné pomocí metodik popisujících jednotlivé fáze procesu dobývání znalostí z databází (CRISP-DM, SEMMA). Nechybí informace o možných praktických využitích technologie a o dostupných produktech na trhu (jak produkty zdarma dostupné, tak produkty komerční). Představení hlavních metod data miningu a konkrétních algoritmů (rozhodovací stromy, asociační pravidla, neuronové sítě a další metody) slouží jako teoretický úvod, na který navazují praktické aplikace nad reálnými daty reálných zdravotních pojišťoven. Jedná se o aplikace hledání příčin nárůstu úhrad a predikce odchodu zákazníků. Tyto aplikace jsem řešil ve zdarma dostupných systémech Weka a LISp-Miner. Cílem je představit a ověřit schopnosti data miningu nad daty tohoto typu a ověřit možnosti zmíněných systémů Weka a LISp-Miner při řešení úloh vzhledem k metodice CRISP-DM. Závěr práce je věnován oblastem cloud a grid computingu ve spojitosti s data miningem. Nabízí pohled na možnosti těchto technologií a jejich přínosy pro technologii data mining. Možnosti využití cloud computingu jsou prezentovány na řešení Amazon EC2, grid computing je možné využít z rozhraní Weka Experimenter.This thesis focuses on data mining technology and its possible practical use in the field of health insurance companies. Thesis defines the term data mining and its relation to the term knowledge discovery in databases. The term data mining is explained, inter alia, with methods describing the individual phases of the process of knowledge discovery in databases (CRISP-DM, SEMMA). There is also information about possible practical applications, technologies and products available in the market (both products available free and commercial products). Introduction of the main data mining methods and specific algorithms (decision trees, association rules, neural networks and other methods) serves as a theoretical introduction, on which are the practical applications of real data in real health insurance companies build. These are applications seeking the causes of increased remittances and churn prediction. I have solved these applications in freely-available systems Weka and LISP-Miner. The objective is to introduce and to prove data mining capabilities over this type of data and to prove capabilities of Weka and LISP-Miner systems in solving tasks due to the methodology CRISP-DM. The last part of thesis is devoted the fields of cloud and grid computing in conjunction with data mining. It offers an insight into possibilities of these technologies and their benefits to the technology of data mining. Possibilities of cloud computing are presented on the Amazon EC2 system, grid computing can be used in Weka Experimenter interface.
Klíčová slova:
asociační pravidla; Bayesovská klasifikace; cloud computing; CRISP-DM; data mining; dobývání znalostí z databází; grid computing; predikce odchodu zákazníků; association rules; Bayesian classification; churn prediction; cloud computing; CRISP-DM; data mining; grid computing; knowledge discovery in databases
Instituce: Vysoká škola ekonomická v Praze
(web)
Informace o dostupnosti dokumentu:
Dostupné v digitálním repozitáři VŠE. Původní záznam: http://www.vse.cz/vskp/eid/23375