Original title:
Geometrický přístup k odhadování rozptýlenosti
Translated title:
Geometric approach to the estimation of scatter
Authors:
Bodík, Juraj ; Nagy, Stanislav (advisor) ; Antoch, Jaromír (referee) Document type: Bachelor's theses
Year:
2019
Language:
eng Abstract:
[eng][cze] In this thesis we describe improved methods of estimating mean and scatter from multivariate data. As we know, the sample mean and the sample variance matrix are non-robust estimators, which means that even a small amount of measurement errors can seriously affect the resulting estimate. We can deal with that problem using MCD estimator (minimum covariance determinant), that finds a sample variance matrix only from a selection of data, specifically those with the smallest determinant of this matrix. This estimator can be also very helpful in outlier detection, which is used in many applications. Moreover, we will introduce the MVE estimator (minimum volume ellipsoid). We will discuss some of the properties and compare these two estimators.V tejto práci popisujeme vylepšené metódy na odhadovanie polohy a rozptýlenosti viacrozmerných dát. Výberový priemer a výberová rozptylová matica sú nerobustné metódy, čo znamená že aj jedno zlé pozorovanie môže tento odhad znehodnotiť. Tento problém rieši MCD odhad (minimum covariance determinant), ktorý spočíta strednú hodnotu a variačnú maticu iba z vhodnej selekcie dát, konkrétne z pozorovaní ktorých variačná matica má najmenší determinant. Vhodná aplikácia je v hľadaní odľahlých pozorovaní. Na záver ukážeme ďalší postup, a to MVE odhad (minimum volume ellipsoid). Budeme diskutovať ich vlastnosti a porovnáme tieto dva odhady.
Keywords:
breakdown point; Mahalanobis distance; MCD estimator; MVE estimator; robustness; scatter matrix; bod zlomu; Mahalanobisova vzdialenosť; matica rozptýlenosti; MCD odhad; MVE odhad; robustnosť
Institution: Charles University Faculties (theses)
(web)
Document availability information: Available in the Charles University Digital Repository. Original record: http://hdl.handle.net/20.500.11956/108262