Název:
Shluková analýza jako nástroj klasifikace objektů
Překlad názvu:
Cluster analysis as a tool for object classification
Autoři:
Vanišová, Adéla ; Löster, Tomáš (vedoucí práce) ; Bílková, Diana (oponent) Typ dokumentu: Diplomové práce
Rok:
2012
Jazyk:
cze
Nakladatel: Vysoká škola ekonomická v Praze
Abstrakt: [cze][eng] Cílem této diplomové práce je prověření schopnosti vybraných metod shlukové analýzy správně segmentovat datový soubor složený pouze z kvantitativních proměnných. Základním kritériem pro datové soubory je předpoklad, že musí být znám počet tříd a příslušnost jednotlivých objektů do těchto tříd. Na základě znalosti o počtu tříd byla provedena shluková analýza. Přiřazení objektů k jednotlivým shlukům bylo následně porovnáno se skutečnou příslušností objektů do původních tříd. Výstupem je relativní úspěšnost vybraných metod na zkoumaných datech. Metody shlukové analýzy samy o sobě nejsou schopné určit, jaký má být optimální počet shluků, proto byly v druhém kroku pro každý zkoumaný datový soubor určeny hodnoty vybraných kritérií odhadujících optimální počet shluků. Na základě tohoto výstupu byla zkoumána schopnost vybraných kritérií správně rozpoznat původní počet tříd. Hlavním přínosem této diplomové práce je validace schopnosti vybraných metod shlukové analýzy identifikovat podobnost objektů a ověření schopnosti vybraných kritérií odhadnout počet shluků, který odpovídá skutečnému rozdělení souboru. Zároveň tato práce nabízí strukturovaný přehled základních metod shlukové analýzy a ukazatelů pro odhad optimálního počtu shluků.The aim of this thesis is to examine the cluster analysis ability segment the data set by selected methods. The data sets are consisting of quantitative variables. The basic criterion for the data sets is that the number of classes has to be known and the next criterion is that the membership of all object to each class has to be known too. Execution of the cluster analysis was based on knowledge about the number of classes. Classified objects to individual clusters were compared with its original classes. The output was the relative success of classification by selected methods. Cluster analysis methods are not able to determine an optimal number of clusters. Estimates of the optimal number of clusters were the second step in analysis for each data set. The ability of selected criteria identify the original number of classes was analyzed by comparing numbers of original classes and numbers of optimal clusters. The main contribution of this thesis is the validation of the ability of selected cluster analysis methods to identify similar objects and verify the ability of selected criteria to estimate the number of clusters corresponding to the real file distribution. Moreover, this work provides a structured overview of the basic cluster analysis methods and indicators for estimating the optimal number of clusters.
Klíčová slova:
metody shlukování; optimální počet shluků; shluková analýza; cluster analysis; methods for cluster analysis; optimal number of clusters
Instituce: Vysoká škola ekonomická v Praze
(web)
Informace o dostupnosti dokumentu:
Dostupné v digitálním repozitáři VŠE. Původní záznam: http://www.vse.cz/vskp/eid/31815