National Repository of Grey Literature 2 records found  Search took 0.01 seconds. 
Classical and recent approaches in cluster analysis
Řezanková, Hana
The paper focuses on the development of selected approaches in cluster analysis. There are recently proposed similarity measures for objects characterized by nominal variables, development of algorithms for k-clustering and development of methods for clustering large data files and categorical data. As concerns algorithms for k-clustering, attention is paid to take into account the uncertainty in classifying objects into clusters, namely FCM (fuzzy k-means), PCM, FPCM, RCM, RFCM and RFPCM algorithms. For large data files, algorithms CURE, ROCK, CLARA, CLARANS and BIRCH are included, for categorical data clustering there are COOLCAT and ROCK algorithms. Two-step cluster analysis to cluster large data sets with variables of different types is mentioned.
Clustering methods for large datasets
Vilikus, Ondřej ; Fialová, Hana (advisor) ; Húsek, Dušan (referee)
S rostoucím množstvím shromažďovaných a ukládaných dat vzniká potřeba shlukovacích metod, které by se dokázaly vypořádat i s rozsáhlými datovými soubory. Proto se objevuje množství nových algoritmů, vycházejících jak ze statistických přístupů, tak i z oblasti strojového učení. Cílem této diplomové práce je stručně představit dostupné metody shlukové analýzy a zhodnotit jejich silné a slabé stránky při analýze velkých souborů. Obsahem teoretické části je shrnutí základních pojmů a principů, které jsou všem metodám společné, a popisu nejznámějších metod shlukové analýzy. Ten obsahuje stručné vysvětlení, na jakém principu fungují a jaké výhody nebo případné nedostatky můžeme při jejich použití očekávat. Praktická část práce je věnována vlastnímu testování osmi metod dostupných v komerčním (SPSS, S-PLUS, STATISTICA) nebo akademickém (Weka) softwaru. Pro testování jsou použity umělé soubory se specifickými charakteristikami, které jsem vygeneroval pomocí vlastního algoritmu. Ten je rozšířením Neyman-Scottova procesu a kromě sférických shluků generuje i shluky nepravidelných tvarů. Výsledky potvrzují očekávání vycházející z teoretických předpokladů. Přinášejí však možnost kvantifikace vlivu charakteru dat na vhodnost jednotlivých metod.

Interested in being notified about new results for this query?
Subscribe to the RSS feed.