Název:
Hodnocení úspěšnosti metod využívaných ve shlukové analýze
Překlad názvu:
Scoring methods used in cluster analysis
Autoři:
Sirota, Sergej ; Löster, Tomáš (vedoucí práce) ; Makhalova, Elena (oponent) Typ dokumentu: Diplomové práce
Rok:
2014
Jazyk:
cze
Nakladatel: Vysoká škola ekonomická v Praze
Abstrakt: [cze][eng] Cílem diplomové práce je porovnat úspěšnost jednotlivých metod shlukování a jejich schopnost správně klasifikovat objekty v datových souborech do předem známých skupin. V teoretické části jsou nejdříve popsány jednotlivé kroky potřebné pro přípravu datového souboru pro samotnou shlukovou analýzu. Další část je pak věnována samotné shlukové analýze, kde jsou popsány způsoby měření podobností jak objektů, tak i shluků. Dále jsou pak popsány jednotlivé metody shlukování využité v samotné praktické části této diplomové práce. V praktické části se již analyzuje 20 souborů, kde každý soubor obsahuje pouze kvantitativní proměnné a třídící znak, podle kterého jsou objekty klasifikovány. U každého souboru jsou spočteny pro každou shlukovou metodu úspěšnosti správného rozřazení objektů do předem známých skupin. V závěru praktické části je pak souhrnný popis výsledků shlukových metod. Hlavním přínosem této práce je zhodnocení úspěšnosti metod shlukování při klasifikaci objektů do předem známých skupin.The aim of the thesis is to compare methods of cluster analysis correctly classify objects in the dataset into groups, which are known. In the theoretical section first describes the steps needed to prepare a data file for cluster analysis. The next theoretical section is dedicated to the cluster analysis, which describes ways of measuring similarity of objects and clusters, and dedicated to description the methods of cluster analysis used in practical part of this thesis. In practical part are described and analyzed 20 files. Each file contains only quantitative variables and sort characters by which objects are sorted. In each file is calculated success rate of object segmentation into groups for each cluster method. At the end of the practical part is a summary description of the results of cluster methods. The main contribution of this thesis is to evaluate the success of cluster methods for classification objects into known groups.
Klíčová slova:
metody shlukové analýzy; měření podobností; průzkumová analýza dat; cluster methods; exploratory data analysis; measures of similarity
Instituce: Vysoká škola ekonomická v Praze
(web)
Informace o dostupnosti dokumentu:
Dostupné v digitálním repozitáři VŠE. Původní záznam: http://www.vse.cz/vskp/eid/44051