Original title:
Dôsledky porušenia predpokladov použitia vybraných štatistických metód
Translated title:
Consequences of assumption violations of selected statistical methods
Authors:
Marcinko, Tomáš ; Blatná, Dagmar (advisor) ; Malá, Ivana (referee) ; Lukáš, Ladislav (referee) Document type: Doctoral theses
Year:
2010
Language:
slo Publisher:
Vysoká škola ekonomická v Praze Abstract:
[slo][cze][eng] Tradičné parametrické metódy štatistickej indukcie a testovania hypotéz sú spravidla odvodené na základe teoretických predpokladov, ktoré môžu, ale nemusia byť splnené v reálnych aplikáciách. V praxi pritom často dochádza k tomu, že tieto metódy sú využívané napriek nesplneniu ich predpokladov, pričom sa vychádza z názoru, že tieto parametrické testové procedúry sú dostatočne necitlivé voči porušeniu príslušných predpokladov. Navyše, alternatívne neparametrické a poradové testy sú často opomínané, a to častokrát z presvedčenia, že tieto metódy dosahujú menšiu silu v porovnaní s parametrickými metódami. Cieľom predkladanej práce je teda popis rizík a dôsledkov použitia klasických jednovýberových a dvojvýberových štatistických metód pri porušení teoretických predpokladov, na základe ktorých boli odvodené, ako aj konzistentné a komplexné porovnanie týchto metód s alternatívnymi neparametrickými a robustnými štatistickými technikami s využitím rozsiahlej simulačnej štúdie, pričom sa práca zameriava predovšetkým na porušenie predpokladu normality a homoskedasticity. Výsledky simulačnej práce potvrdili, že klasické parametrické metódy sú relatívne robustné, aj keď s výhradou v prípade výskytu odľahlých pozorovaní, kedy klasické metódy môžu zlyhávať. Naopak, spracovaná štúdia jasne empiricky dokázala, že klasické parametrické metódy pri porušení svojich predpokladov rýchle strácajú svoje optimálne vlastnosti, a napríklad v mnohých prípadoch porušenia predpokladu normálneho rozdelenia náhodného výberu dosahujú väčšiu silu vhodné neparametrické a poradové testové procedúry, a tak tvrdenie, že použitie týchto metód je neefektívne z dôvodu ich menšej sily, možno považovať za kritický omyl. Výber vhodnej neparametrickej metódy však spravidla závisí na konkrétnej forme rozdelenia náhodného výberu.Tradiční parametrické metody statistické indukce a testování hypotéz jsou zpravidla odvozeny na základě teoretických předpokladů, které mohou, ale nemusí být splněny v reálných aplikacích. V praxi přitom často dochází k tomu, že tyto metody jsou využívány přes nesplnění jejich předpokladů, přičemž se vychází z názoru, že tyto parametrické testové procedury jsou dostatečně necitlivé vůči porušení příslušných předpokladů. Navíc, alternativní neparametrické a pořadové testy jsou často opomíjené, a to častokrát z přesvědčení, že tyto metody dosahují menší sílu v porovnání s parametrickými metodami. Cílem předkládané práce je tedy popis rizik a důsledků použití klasických jednovýběrových a dvouvýběrových statistických metod při porušení teoretických předpokladů, na základě kterých byly odvozeny, jakož i konzistentní a komplexní srovnání těchto metod s alternativními neparametrickými a robustními statistickými technikami s využitím rozsáhlé simulační studie, přičemž se práce zaměřuje především na porušení předpokladu normality a homoskedasticity. Výsledky simulační práce potvrdily, že klasické parametrické metody jsou relativně robustní, i když s výhradou v případě výskytu odlehlých pozorování, kdy klasické metody mohou selhávat. Naopak zpracována studie jasně empiricky prokázala, že klasické parametrické metody při porušení svých předpokladů rychlé ztrácejí své optimální vlastnosti, a například v mnoha případech porušení předpokladu normálního rozdělení náhodného výběru dosahují větší sílu vhodné neparametrické a pořadové testové procedury, a tak tvrzení, že použití těchto metod je neefektivní z důvodu jejich menší síly, lze považovat za kritický omyl. Výběr vhodné neparametrické metody však zpravidla závisí na konkrétní formě rozdělení náhodného výběru.Classical parametric methods of statistical inference and hypothesis testing are derived under fundamental theoretical assumptions, which may or may not be met in real world applications. However, these methods are usually used despite the violation of their underlying assumptions, while it is argued, that these methods are quite insensitive to the violation of relevant assumptions. Moreover, alternative nonparametric or rank tests are often overlooked, mostly because these methods may be deemed to be less powerful then parametric methods. The aim of the dissertation is therefore a description of the consequences of assumption violations concerning classical one-sample and two-sample statistical methods and a consistent and comprehensive comparison of parametric, nonparametric and robust statistical techniques, which is based on extensive simulation study and focused mostly on a normality and heteroscedasticity assumption violation. The results of the simulation study confirmed that the classical parametric methods are relatively robust, with some reservations in case of outlying observations, when traditional methods may fail. On the other hand, the empirical study clearly proved that the classical parametric methods are losing their optimal properties, when the underlying assumptions are violated. For example, in many cases of non-normality the appropriate nonparametric and rank-based methods are more powerful, and therefore a statement, that these methods are unproductive due to their lack of power may be considered a crucial mistake. However, the choice of the most appropriate distribution-free method generally depends on the particular form of the underlying distribution.
Keywords:
assumptions violation; bootstrap; rank tests; robust estimates; statistical hypothesis testing; uniformly most powerful tests; bootstrap; porušení předpokladů; pořadové testy; robustní odhady; rovnoměrně nejsilnější testy; statistické testování hypotéz
Institution: University of Economics, Prague
(web)
Document availability information: Available in the digital repository of the University of Economics, Prague. Original record: http://www.vse.cz/vskp/eid/52711