Název:
Determination of the Number of Clusters and Identification of Outliers in Statistical Software Packages
Překlad názvu:
Metody identifikace počtu shluků a odlehlých hodnot implementované v profesionálních statistických programových systémech
Autoři:
Řezanková, H. ; Húsek, Dušan Typ dokumentu: Příspěvky z konference Konference/Akce: MSED 2007. Mezinárodní statistickoekonomické dny na VŠE v Praze, Praha (CZ), 2007-09-20
Rok:
2007
Jazyk:
eng
Abstrakt: [eng][cze] The paper deals with possibilities how to determine the optimal number of groups of objects and find outlying objects when objects are clustered by different methods implemented in commercial statistical software packages. In the example, the aim is finding groups of similar binary variables. The methods as cluster analyses (hierarchical, k-medoids, fuzzy, two-step), multidimensional scaling, factor analysis and Boolean factor analysis are used.Příspěvek se zabývá možnostmi stanovení optimálního počtu skupin objektů a nalezení odlehlých objektů při shlukování pomocí různých metod implementovaných v komerčních statistických programových systémech. V uvedeném příkladu je cílem nalézt skupiny podobných binárních proměnných. Použita je shluková analýza (hierarchická, k-medoidů, fuzzy, dvoukroková), vícerozměrné škálování, faktorová analýza (FA) a Booleovská FA.
Klíčová slova:
cluster analysis; number of clusters; outliers; software packages Číslo projektu: CEZ:AV0Z10300504 (CEP), GA201/05/0079 (CEP) Poskytovatel projektu: GA ČR Zdrojový dokument: Mezinárodní statistickoekonomické dny na VŠE v Praze, ISBN 978-80-254-0275-7
Instituce: Ústav informatiky AV ČR
(web)
Informace o dostupnosti dokumentu:
Dokument je dostupný v příslušném ústavu Akademie věd ČR. Původní záznam: http://hdl.handle.net/11104/0151502