Název:
Srovnání heuristických a konvenčních statistických metod v data miningu
Překlad názvu:
Comparison of Heuristic and Conventional Statistical Methods in Data Mining
Autoři:
Bitara, Matúš ; Žák, Libor (oponent) ; Bednář, Josef (vedoucí práce) Typ dokumentu: Diplomové práce
Rok:
2019
Jazyk:
slo
Nakladatel: Vysoké učení technické v Brně. Fakulta strojního inženýrství
Abstrakt: [slo][eng]
Táto práca sa zaoberá porovnaním konvenčných a heuristických metód v data miningu používaných na binárnu klasifikáciu. V teoretickej časti sú popísané štyri rôzne modely. Klasifikácia modelov je demonštrovaná na jednoduchých príkladoch. V praktickej časti sú modely porovnané na reálnych dátach. Táto časť obsahuje aj čistenie dát, odstránenie odľahlých hodnôt, dve rôzne transformácie a redukciu dimenzie. V poslednej časti sú popísané metódy používané na testovanie kvality modelu.
The thesis deals with the comparison of conventional and heuristic methods in data mining used for binary classification. In the theoretical part, four different models are described. Model classification is demonstrated on simple examples. In the practical part, models are compared on real data. This part also consists of data cleaning, outliers removal, two different transformations and dimension reduction. In the last part methods used to quality testing of models are described.
Klíčová slova:
AUC; data mining; decision trees; gradient boosting; logistic regression; Python; random forest; ROC
Instituce: Vysoké učení technické v Brně
(web)
Informace o dostupnosti dokumentu:
Plný text je dostupný v Digitální knihovně VUT. Původní záznam: http://hdl.handle.net/11012/175535