Original title:
Vybrané transformace náhodných veličin užívané v klasické lineární regresi
Translated title:
Selected random variables transformations used in classical linear regression
Authors:
Tejkal, Martin ; Michálek, Jaroslav (referee) ; Hübnerová, Zuzana (advisor) Document type: Master’s theses
Year:
2017
Language:
eng Publisher:
Vysoké učení technické v Brně. Fakulta strojního inženýrství Abstract:
[eng][cze]
Klasická lineární regrese a z ní odvozené testy hypotéz jsou založeny na předpokladu normálního rozdělení a shodnosti rozptylu závislých proměnných. V případě že jsou předpoklady normality porušeny, obvykle se užívá transformací závisle proměnných. První část této práce se zabývá transformacemi stabilizujícími rozptyl. Značná pozornost je udělena náhodným veličinám s Poissonovým a negativně binomickým rozdělením, pro které jsou studovány zobecněné transformace stabilizující rozptyl obsahující parametry v argumentu navíc. Pro tyto parametry jsou stanoveny jejich optimální hodnoty. Cílem druhé části práce je provést srovnání transformací uvedených v první části a dalších často užívaných transformací. Srovnání je provedeno v rámci analýzy rozptylu testováním hypotézy shodnosti středních hodnot p nezávislých náhodných výběrů s pomocí F testu. V této části jsou nejprve studovány vlastnosti F testu za předpokladu shodných a neshodných rozptylů napříč výběry. Následně je provedeno srovnání silofunkcí F testu aplikovaného pro p výběrů z Poissonova rozdělení transformovanými odmocninovou, logaritmickou a Yeo Johnsnovou transformací a z negativně binomického rozdělení transformovaného argumentem hyperbolického sinu, logaritmickou a Yeo-Johnsnovou transformací.
Classical linear regression model and the respective tests are based on an assumption of normally distributed response variables and on an assumption of variance equality. If the normality assumption is not fulfilled, then the response variables are usually transformed. In the first part of this work variance stabilising transformations are discussed. Great deal of attention is given to random variables of Poisson and negative binomial distribution, for which generalised variance stabilising transformations with addition constants in their arguments are studied. Optimal values of the constants for the generalised transformations are determined. The second part aims to provide a comparison of the transformations introduced in the first part and some other commonly used transformations. The comparison is done within the ANOVA framework by testing the hypothesis of equality of expectations among p random samples via F test. The properties of the distribution of the F test under the assumptions of equal and unequal variances are studied. Finally a comparison of the power functions of the F test applied to p random samples from Poisson distribution transformed via square root, logarithmic and Yeo-Johnson transformation, and to p random sample of negative binomial distribution transformed via argument of hyperbolic sine, logarithmic and the Yeo-Johnson transformation is carried out theoretically and by simulations.
Keywords:
ANOVA; F-test; Lineární regrese; logaritmická transformace; negativně binomické rozdělení; odmocninová transformace; Poissonovo rozdělení; silofunkce; transformace argument hyperbolického sinu; transformace stabilizující rozptyl; Yeo-Johnsnova transformace; ANOVA; argument of hyperbolic sine transformation; F-test; Linear regression; logarithmic transformation; negative binomial distribution; Poisson distribution; power function; square root transformation; variance stabilising transformation; Yeo-Johnson transformation
Institution: Brno University of Technology
(web)
Document availability information: Fulltext is available in the Brno University of Technology Digital Library. Original record: http://hdl.handle.net/11012/66650