Original title:
Vliv selekce příznaků metodou HFS na shlukovou analýzu
Translated title:
Effect of HFS Based Feature Selection on Cluster Analysis
Authors:
Malásek, Jan ; Klusáček, Jan (referee) ; Honzík, Petr (advisor) Document type: Master’s theses
Year:
2015
Language:
cze Publisher:
Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií Abstract:
[cze][eng]
Diplomová práce se zabývá shlukovou analýzou. Shlukování má své základy v mnoha oblastech lidského vědění zahrnujících získávání dat, statistiku, biologii a strojové učení. Hlavní náplní práce je zpracování rešerše metod shlukové analýzy, metod pro stanovení počtu shluků a stručný přehled metod selekce příznaků v úlohách bez učitele. Neméně důležitou součástí je realizace softwaru pro porovnání různých metod shlukové analýzy se zaměřením na úspěšnost při stanovování počtu shluků a řazení jednotlivých instancí do správných tříd. Součástí programu je implementace metody selekce příznaků HFS. Experimentální ověření metod proběhlo ve vývojovém prostředí Matlab. Ve svém závěru diplomová práce porovnává úspěšnost shlukovacích metod na datech se známými výstupními třídami a posuzuje přínos metody selekce příznaků HFS v úlohách bez učitele pro úspěšnost shlukové analýzy
Master´s thesis is focused on cluster analysis. Clustering has its roots in many areas, including data mining, statistics, biology and machine learning. The aim of this thesis is to elaborate a recherche of cluster analysis methods, methods for determining number of clusters and a short survey of feature selection methods for unsupervised learning. The very important part of this thesis is software realization for comparing different cluster analysis methods focused on finding optimal number of clusters and sorting data points into correct classes. The program also consists of feature selection HFS method implementation. Experimental methods validation was processed in Matlab environment. The end of master´s thesis compares success of clustering methods using data with known output classes and assesses contribution of feature selection HFS method for unsupervised learning for quality of cluster analysis.
Keywords:
Clustering analysis; feature selection; HFS.; unsupervised learning; HFS.; selekce příznaků; Shluková analýza; učení bez učitele
Institution: Brno University of Technology
(web)
Document availability information: Fulltext is available in the Brno University of Technology Digital Library. Original record: http://hdl.handle.net/11012/38592