Název:
Statistické metody pro analýzu dat s chybějícími pozorováními
Překlad názvu:
Statistical analysis of datasets with missing observations
Autoři:
Janoušková, Kateřina ; Omelka, Marek (vedoucí práce) ; Kulich, Michal (oponent) Typ dokumentu: Diplomové práce
Rok:
2016
Jazyk:
cze
Abstrakt: [cze][eng] Práce se zabývá mechanismy chybějících dat a metodami, jak se s nimi vypořádat. Rozlišuje tři mechanismy chybějících dat - MCAR, MAR a MNAR. Jsou uvedeny dvě jednoduché metody používající vyřazování neúplných záznamů a ukázány jejich vlastnosti a nedostatky. Dále je popsán princip jedno- duchých imputací. Odvozeny a porovnány jsou EM algoritmus používající kla- sickou statistiku a algoritmus augmentace dat používající bayesovskou statistiku. Poslední metodou, které se práce věnuje, je mnohonásobná imputace. Některé odvozené metody jsou aplikovány na reálná data, nejdříve pro spojité veličiny a poté pro dvourozměrnou kontingenční tabulku. 1Mechanisms of missing data and methods are described in this thesis. Three mechanisms are considered - MCAR, MAR, MNAR. Two simple methods using deletion of incomplete records are shown and their properties and shortcomings are demonstrated. Secondly, the principle of simple imputations is explained. EM algorithm which uses the classical statistics and the algorithm of data augmentation which uses Bayesian framework are derived and compared. The last method included in the thesis is the multiple imputation. The described methods are compared on real data set, first on continuous variables and then on a contingency table. 1