Original title:
Srovnání heuristických a konvenčních statistických metod v data miningu
Translated title:
Comparison of Heuristic and Conventional Statistical Methods in Data Mining
Authors:
Bitara, Matúš ; Žák, Libor (referee) ; Bednář, Josef (advisor) Document type: Master’s theses
Year:
2019
Language:
slo Publisher:
Vysoké učení technické v Brně. Fakulta strojního inženýrství Abstract:
[slo][eng]
Táto práca sa zaoberá porovnaním konvenčných a heuristických metód v data miningu používaných na binárnu klasifikáciu. V teoretickej časti sú popísané štyri rôzne modely. Klasifikácia modelov je demonštrovaná na jednoduchých príkladoch. V praktickej časti sú modely porovnané na reálnych dátach. Táto časť obsahuje aj čistenie dát, odstránenie odľahlých hodnôt, dve rôzne transformácie a redukciu dimenzie. V poslednej časti sú popísané metódy používané na testovanie kvality modelu.
The thesis deals with the comparison of conventional and heuristic methods in data mining used for binary classification. In the theoretical part, four different models are described. Model classification is demonstrated on simple examples. In the practical part, models are compared on real data. This part also consists of data cleaning, outliers removal, two different transformations and dimension reduction. In the last part methods used to quality testing of models are described.
Keywords:
AUC; data mining; decision trees; gradient boosting; logistic regression; Python; random forest; ROC
Institution: Brno University of Technology
(web)
Document availability information: Fulltext is available in the Brno University of Technology Digital Library. Original record: http://hdl.handle.net/11012/175535