Original title:
Kritéria těsnosti regrese dle typu vysvětlované proměnné
Translated title:
Regression goodness-of-fit criteria according to dependent variable type
Authors:
Šimsa, Filip ; Hanzák, Tomáš (advisor) ; Hlubinka, Daniel (referee) Document type: Bachelor's theses
Year:
2012
Language:
cze Abstract:
[cze][eng] Práce se věnuje popisu modelů lineární, logistické, ordinální a mul- tinomické regrese a interpretaci jejích parametrů. Dále zavádí různé ukazatele kvality modelu a vztahy mezi nimi. Soustředí se zejména na Giniho koeficient a koeficient determinace R2 . První zmíněný je zaveden pomocí modifikace Lo- renzovy křivky pro ordinální a spojitou proměnnou a na základě porovnávání odhadnutých pravděpodobností pro proměnnou nominální. Koeficient determi- nace R2 je nově definován pro nominální proměnnou, u které je zkoumán jeho vztah k Giniho koeficientu. Za předpokladu normálně rozdělených skóre a chyb modelu je numericky odvozena závislost mezi Giniho koeficientem a koeficien- tem determinace pro různá spojitá rozdělení vysvětlované proměnné. Teoretické výpočty a definice jsou ilustrovány na dvou sadách reálných dat. 1This work is devoted to the description of linear, logistic, ordinal and multinominal regression models and interpretation of its parameters. Then it introduces a variety of quality indicators of mathematical models and the re- lations between them. It focuses mainly on the Gini coefficient and the coefficient of determination R2 . The first mentioned is established by modifying the Lorenz curve for ordinal and continuous variables and by comparing the estimated proba- bilities for nominal variable. The coefficient of determination R2 is newly defined for the nominal variable and is examined its relationship with Gini coefficient. As- suming normally distributed scores and errors of the model is numerically derived the relation between the Gini coefficient and the coefficient of determiantion for different distribution of continuous dependent variable. Theoretical calculations and definitions are illustrated on two real data sets. 1
Keywords:
coefficient of determination; Gini coefficient; Logistic regression; Lorenz curve; Giniho koeficient; koeficient determinace; Logistická regrese; Lorenzova křivka
Institution: Charles University Faculties (theses)
(web)
Document availability information: Available in the Charles University Digital Repository. Original record: http://hdl.handle.net/20.500.11956/40599