Original title:
Klasické a současné postupy ve shlukové analýze
Translated title:
Classical and recent approaches in cluster analysis
Authors:
Řezanková, Hana Document type: Papers Conference/Event: Analýza dat 2013. Statistické metody pro technologii, kvalitu a výzkum, Pardubice (CZ), 2013-11-19 / 2013-11-21
Year:
2013
Language:
cze Abstract:
[cze][eng] Článek se zaměřuje na vývoj vybraných postupů ve shlukové analýze. Jde o nedávno navržené míry podobnosti pro objekty charakterizované nominálními proměnnými, vývoj algoritmů pro k-shlukování a vývoj metod pro shlukování v případě velkých datových souborů a kategoriálních dat. U algoritmů pro k-shlukování je pozornost věnována zohlednění neurčitosti při zařazování objektů do shluků, konkrétně algoritmům FCM (fuzzy k-průměrů), PCM, FPCM, RCM, RFCM a RFPCM. Pro velké datové soubory jsou zařazeny algoritmy CURE, ROCK, CLARA, CLARANS a BIRCH, pro shlukování kategoriálních dat pak algoritmy COOLCAT a ROCK. Zmíněna je též dvoukroková shluková analýza pro shlukování velkých datových souborů s proměnnými různých typů.The paper focuses on the development of selected approaches in cluster analysis. There are recently proposed similarity measures for objects characterized by nominal variables, development of algorithms for k-clustering and development of methods for clustering large data files and categorical data. As concerns algorithms for k-clustering, attention is paid to take into account the uncertainty in classifying objects into clusters, namely FCM (fuzzy k-means), PCM, FPCM, RCM, RFCM and RFPCM algorithms. For large data files, algorithms CURE, ROCK, CLARA, CLARANS and BIRCH are included, for categorical data clustering there are COOLCAT and ROCK algorithms. Two-step cluster analysis to cluster large data sets with variables of different types is mentioned.
Keywords:
fuzzy shlukování; metody k-medoidů; metody k-průměrů; míry podobnosti; nominální proměnné; shluková analýza; velké datové soubory Host item entry: Analýza dat 2013. Statistické metody pro technologii a výzkum, ISSN 1805-6903
Institution: Institute of Computer Science AS ČR
(web)
Document availability information: Fulltext is available at the institute of the Academy of Sciences. Original record: http://hdl.handle.net/11104/0226491