Original title:
Rozhodovací stromy
Translated title:
Decision trees
Authors:
Jahoda, Miroslav ; Mrázová, Iveta (advisor) ; Gregor, Petr (referee) Document type: Master’s theses
Year:
2009
Language:
cze Abstract:
[cze][eng] Mezi známé metody dobývání znalostí patří neuronové sítě, ILP, asociační pravidla, Bayesovské sítě, klastrování, rozhodovací stromy a další. Tato práce se zabývá právě rozhodovacími stromy, jejich implementací, vizualizací, extrakcí pravidel a také porovnáváním různých rozhodovacích stromů a modelů pro klasifikaci dat vůbec. Nedílnou součástí procesu dobývání znalostí je také předzpracování dat, které hraje důležitou roli a je také rozebíráno v této práci. Součástí této práce je i porovnání různých modelů rozhodovacích stromů jako CART, CHAID, C5.0 (See5) a jiných na množině 3 druhů dat. Nakonec jsou výsledky porovnány s výsledky na předzpracovaných datech pomocí PCA analýzy.Among the known methods of data mining are neural networks, ILP, associative rules, Bayes networks, clustering, decision trees and others. This thesis is about decision trees, their implementation, visualization, extraction rules and the comparison of different decision trees and models of classification data in general. An integral part of the data mining process is preprocessing of data, which plays an important role and is also discussed in this thesis. Part of this thesis also concerns the comparison of different decision tree models such as CART, CHAID, C5.0 (See5) and others on a set of 3 data kinds. Finally, this model's results are compared to its results when data preprocessed by PCA analysis is used.
Institution: Charles University Faculties (theses)
(web)
Document availability information: Available in the Charles University Digital Repository. Original record: http://hdl.handle.net/20.500.11956/30665