Original title:
Hlavní komponenty
Translated title:
Principal components
Authors:
Zavadilová, Anna ; Hlávka, Zdeněk (advisor) ; Nagy, Stanislav (referee) Document type: Master’s theses
Year:
2018
Language:
cze Abstract:
[cze][eng] Práce představuje hlavní komponenty jako užitečný nástroj pro snížení di- menze datového souboru. V první části jsou uvedeny teoretické vlastnosti hlav- ních komponent a je zde odvozena konstrukce biplotu. Dále jsou shrnuty heu- ristické procedury pro volbu optimálního počtu hlavních komponent. Následně jsou uvedeny asymptotické vlastnosti výběrových vlastních čísel kovarianční a bílé Wishartovy matice, rozliší se případy rovnosti některých vlastních čísel. Ve druhé části je podrobně popsáno asymptotické rozdělení největšího vlastního čísla bílé Wishartovy matice doplněné o grafické ilustrace. Na základě tohoto asymptotic- kého rozdělení odvodíme test počtu signifikantních vlastních čísel a představíme souvislost testu s volbou vhodného počtu hlavních komponent. V závěrečné části práce shrneme pokročilé výpočetní metody pro volbu počtu hlavních komponent. Práce je doplněna grafickými ilustracemi a simulační studií v softwarech Wolfram Mathematica a R.This thesis presents principal components as a useful tool for data dimensio- nality reduction. In the first part, the basic terminology and theoretical properties of principal components are described and a biplot construction is derived there as well. Besides, heuristic methods for a choice of the optimum number of prin- cipal components are summarised there. Subsequently, asymptotical properties of sample eigenvalues of covariance and white Wishart matrices are described and cases of equality of some eigenvalues are distinguished at the same time. In the second part of the thesis, asymptotic distribution of the largest eigenva- lue of white Wishart matrices is described, completed with graphic illustrations. A test of the number of significant eigenvalues is suggested on the basis of this limiting distribution, and the connection of this test to the number of suitable principal components is presented. The final part of the thesis provides an over- view of advanced computational methods for the choice of an adequate number of principal components. The thesis is completed with graphical illustrations and a simulation study using Wolfram Mathematica and R.
Keywords:
Principal components; sample eigenvalues; Tracy-Widom distribution; Hlavní komponenty; Tracyho-Widomovo rozdělení; výběrová vlastní čísla
Institution: Charles University Faculties (theses)
(web)
Document availability information: Available in the Charles University Digital Repository. Original record: http://hdl.handle.net/20.500.11956/103440