Název:
Využití numerické lineární algebry k urychlení výpočtu odhadů MCD
Překlad názvu:
Exploiting numerical linear algebra to accelerate the computation of the MCD estimator
Autoři:
Sommerová, Kristýna ; Duintjer Tebbens, Erik Jurjen (vedoucí práce) ; Hnětynková, Iveta (oponent) Typ dokumentu: Diplomové práce
Rok:
2018
Jazyk:
cze
Abstrakt: [cze][eng] Práce se zabývá urychlením algoritmizace estimátoru MCD pro odhad střední hodnoty a varianční matice normálně rozdělených mnohorozměrných dat zatíže- ných odlehlými hodnotami. Rozvádí nejprve myšlenku estimátoru a jeho známou aproximaci - algoritmus FastMCD. Důraz práce měl být především kladen na možné urychlení přímo iteračního kroku zvaného C-step ve FastMCD při zacho- vání kvality odhadů estimátoru. To se ukazálo přinejmenším jako obtížné. Práce se proto zaměřuje především na novou implementaci založenou na C-stepu a Ja- cobiho metodě pro vlastní čísla. Navrhovaný JacobiMCD je porovnán s FastMCD co do počtu operací a získávaných výsledků. Na závěr konstatuje, že JacobiMCD není přímo ekvivalentní s FastMCD, ale je možné ho použít na data velkých roz- měrů, kde z numerických experimentů vyplývá urychlení výpočtů o řád, přičemž kvalita výsledku se za určitého nastavení řádově blíží FastMCD. 1This work is dealing with speeding up the algorithmization of the MCD es- timator for detection of the mean and the covariance matrix of a normally dis- tributed multivariate data contaminated with outliers. First, the main idea of the estimator and its well-known aproximation by the FastMCD algorithm is discussed. The main focus was to be placed on possibilities of a speedup of the iteration step known as C-step while maintaining the quality of the estimations. This proved to be problematic, if not impossible. The work is, therefore, aiming at creating a new implementation based on the C-step and Jacobi method for eigenvalues. The proposed JacobiMCD algorithm is compared to the FastMCD in terms of floating operation count and results. In conclusion, JacobiMCD is not found to be fully equivalent to FastMCD but hints at a possibility of its usage on larger problems. The numerical experiments suggest that the computation can indeed be quicker by an order of magnitude, while the quality of results is close to those from FastMCD in some settings. 1
Klíčová slova:
C-step; Jacobiho metoda; minimalizace determinantu; robustní statistika; C-step; determinant minimization; Jacobi method; robust statistics