Original title:
Determination of the Number of Clusters and Identification of Outliers in Statistical Software Packages
Translated title:
Metody identifikace počtu shluků a odlehlých hodnot implementované v profesionálních statistických programových systémech
Authors:
Řezanková, H. ; Húsek, Dušan Document type: Papers Conference/Event: MSED 2007. Mezinárodní statistickoekonomické dny na VŠE v Praze, Praha (CZ), 2007-09-20
Year:
2007
Language:
eng Abstract:
[eng][cze] The paper deals with possibilities how to determine the optimal number of groups of objects and find outlying objects when objects are clustered by different methods implemented in commercial statistical software packages. In the example, the aim is finding groups of similar binary variables. The methods as cluster analyses (hierarchical, k-medoids, fuzzy, two-step), multidimensional scaling, factor analysis and Boolean factor analysis are used.Příspěvek se zabývá možnostmi stanovení optimálního počtu skupin objektů a nalezení odlehlých objektů při shlukování pomocí různých metod implementovaných v komerčních statistických programových systémech. V uvedeném příkladu je cílem nalézt skupiny podobných binárních proměnných. Použita je shluková analýza (hierarchická, k-medoidů, fuzzy, dvoukroková), vícerozměrné škálování, faktorová analýza (FA) a Booleovská FA.
Keywords:
cluster analysis; number of clusters; outliers; software packages Project no.: CEZ:AV0Z10300504 (CEP), GA201/05/0079 (CEP) Funding provider: GA ČR Host item entry: Mezinárodní statistickoekonomické dny na VŠE v Praze, ISBN 978-80-254-0275-7
Institution: Institute of Computer Science AS ČR
(web)
Document availability information: Fulltext is available at the institute of the Academy of Sciences. Original record: http://hdl.handle.net/11104/0151502