Original title:
Metody klasifikace www stránek
Translated title:
Methods for Classification of WWW Pages
Authors:
Svoboda, Pavel ; Burget, Radek (referee) ; Bartík, Vladimír (advisor) Document type: Master’s theses
Year:
2009
Language:
cze Publisher:
Vysoké učení technické v Brně. Fakulta informačních technologií Abstract:
[cze][eng]
Hlavním cílem této diplomové práce bylo prostudovat podstatné části klasifikačních metod. Práce obsahuje klíčové klasifikační metody, vysvětluje princip získávání znalostí z databází, pojem datový sklad a třídu CSSBox. Speciálně se zaměřuje na implementování hlavní metody k-nejbližších sousedů. První cílem této práce bylo vytvořit trénovací a testovací data popsaná 'n' atributy. Druhým cílem bylo experimentálně určit, jak zvolit správnou hodnotu 'k', tedy počet sousedů.
The main goal of this master's thesis was to study the main principles of classification methods. Basic principles of knowledge discovery process, data mining and using an external class CSSBox are described. Special attantion was paid to implementation of a ,,k-nearest neighbors`` classification method. The first objective of this work was to create training and testing data described by 'n' attributes. The second objective was to perform experimental analysis to determine a good value for 'k', the number of neighbors.
Keywords:
Bayesian classification; C4.5; Classifieds methods; CSSBox; Data mining; Data Warehouse; Decision tree; Gini index; ID3; k-NN; Knowledge discovery; Neural Networks; SVM; Bayesovská klasifikace; C4.5; CSSBox; Datový sklad; Dolování dat; Gini index; ID3; k-NN; Klasifikační metody; Neuronová síť; Rozhodovací strom; SVM; Získávání znalostí
Institution: Brno University of Technology
(web)
Document availability information: Fulltext is available in the Brno University of Technology Digital Library. Original record: http://hdl.handle.net/11012/53786