Název:
Klasické a současné postupy ve shlukové analýze
Překlad názvu:
Classical and recent approaches in cluster analysis
Autoři:
Řezanková, Hana Typ dokumentu: Příspěvky z konference Konference/Akce: Analýza dat 2013. Statistické metody pro technologii, kvalitu a výzkum, Pardubice (CZ), 2013-11-19 / 2013-11-21
Rok:
2013
Jazyk:
cze
Abstrakt: [cze][eng] Článek se zaměřuje na vývoj vybraných postupů ve shlukové analýze. Jde o nedávno navržené míry podobnosti pro objekty charakterizované nominálními proměnnými, vývoj algoritmů pro k-shlukování a vývoj metod pro shlukování v případě velkých datových souborů a kategoriálních dat. U algoritmů pro k-shlukování je pozornost věnována zohlednění neurčitosti při zařazování objektů do shluků, konkrétně algoritmům FCM (fuzzy k-průměrů), PCM, FPCM, RCM, RFCM a RFPCM. Pro velké datové soubory jsou zařazeny algoritmy CURE, ROCK, CLARA, CLARANS a BIRCH, pro shlukování kategoriálních dat pak algoritmy COOLCAT a ROCK. Zmíněna je též dvoukroková shluková analýza pro shlukování velkých datových souborů s proměnnými různých typů.The paper focuses on the development of selected approaches in cluster analysis. There are recently proposed similarity measures for objects characterized by nominal variables, development of algorithms for k-clustering and development of methods for clustering large data files and categorical data. As concerns algorithms for k-clustering, attention is paid to take into account the uncertainty in classifying objects into clusters, namely FCM (fuzzy k-means), PCM, FPCM, RCM, RFCM and RFPCM algorithms. For large data files, algorithms CURE, ROCK, CLARA, CLARANS and BIRCH are included, for categorical data clustering there are COOLCAT and ROCK algorithms. Two-step cluster analysis to cluster large data sets with variables of different types is mentioned.
Klíčová slova:
fuzzy shlukování; metody k-medoidů; metody k-průměrů; míry podobnosti; nominální proměnné; shluková analýza; velké datové soubory Zdrojový dokument: Analýza dat 2013. Statistické metody pro technologii a výzkum, ISSN 1805-6903
Instituce: Ústav informatiky AV ČR
(web)
Informace o dostupnosti dokumentu:
Dokument je dostupný v příslušném ústavu Akademie věd ČR. Původní záznam: http://hdl.handle.net/11104/0226491