Název:
Kritéria těsnosti regrese dle typu vysvětlované proměnné
Překlad názvu:
Regression goodness-of-fit criteria according to dependent variable type
Autoři:
Šimsa, Filip ; Hanzák, Tomáš (vedoucí práce) ; Hlubinka, Daniel (oponent) Typ dokumentu: Bakalářské práce
Rok:
2012
Jazyk:
cze
Abstrakt: [cze][eng] Práce se věnuje popisu modelů lineární, logistické, ordinální a mul- tinomické regrese a interpretaci jejích parametrů. Dále zavádí různé ukazatele kvality modelu a vztahy mezi nimi. Soustředí se zejména na Giniho koeficient a koeficient determinace R2 . První zmíněný je zaveden pomocí modifikace Lo- renzovy křivky pro ordinální a spojitou proměnnou a na základě porovnávání odhadnutých pravděpodobností pro proměnnou nominální. Koeficient determi- nace R2 je nově definován pro nominální proměnnou, u které je zkoumán jeho vztah k Giniho koeficientu. Za předpokladu normálně rozdělených skóre a chyb modelu je numericky odvozena závislost mezi Giniho koeficientem a koeficien- tem determinace pro různá spojitá rozdělení vysvětlované proměnné. Teoretické výpočty a definice jsou ilustrovány na dvou sadách reálných dat. 1This work is devoted to the description of linear, logistic, ordinal and multinominal regression models and interpretation of its parameters. Then it introduces a variety of quality indicators of mathematical models and the re- lations between them. It focuses mainly on the Gini coefficient and the coefficient of determination R2 . The first mentioned is established by modifying the Lorenz curve for ordinal and continuous variables and by comparing the estimated proba- bilities for nominal variable. The coefficient of determination R2 is newly defined for the nominal variable and is examined its relationship with Gini coefficient. As- suming normally distributed scores and errors of the model is numerically derived the relation between the Gini coefficient and the coefficient of determiantion for different distribution of continuous dependent variable. Theoretical calculations and definitions are illustrated on two real data sets. 1
Klíčová slova:
Giniho koeficient; koeficient determinace; Logistická regrese; Lorenzova křivka; coefficient of determination; Gini coefficient; Logistic regression; Lorenz curve