Original title:
Statistické usuzování v analýze kategoriálních dat
Translated title:
Statistical inference for categorical data analysis
Authors:
Kocáb, Jan ; Pecáková, Iva (advisor) ; Coufalová, Petra (referee) Document type: Master’s theses
Year:
2010
Language:
cze Publisher:
Vysoká škola ekonomická v Praze Abstract:
[cze][eng] Tato práce se zabývá statistickými metodami v analýze kategoriálních dat. Tyto metody jsou rozšířené především v sociálních vědách jako sociologie, psychologie nebo politologie, ale jejich význam vzrůstá také v medicíně a technických vědách. V první části je věnována pozornost úsudkům o relativní četnosti. Jsou zde popsány klasické, exaktní a Bayesovské způsoby odhadů a testování hypotéz. Uvažován je případ velkého výběru, kdy lze nahradit přesné rozdělení normálním, tak případ malého výběru, kdy aproximace není možná a je nutné použít nespojité rozdělení, z čehož vznikají specifické problémy. Druhá část je zaměřena na analýzu dvou kategoriálních proměnných v kontingenčních tabulkách. Jsou zde objasněny pojmy jako rozdíl relativních četností nebo poměr šancí a je rovněž ukázáno, jak se testuje nezávislost proměnných v případě velkého a malého výběru. V případě malého výběru nelze použít klasické chí-kvadrát testy nezávislosti a je nutno využít alternativní metody. V této části jsou vysvětleny různé exaktní testy a také Bayesovský přístup v kontingenčních tabulkách typu 2 x 2. Konec této části je věnován tabulce pro dva závislé výběry, kde nás zajímá, zda se v populaci shoduje zastoupení kategorií dvojice proměnných, což nastává při stejných marginálních relativních četnostech obou proměnných. V poslední části práce jsou metody použity na datech a okomentovány výsledky.This thesis introduces statistical methods for categorical data. These methods are especially used in social sciences such as sociology, psychology and political science, but their importance has increased also in medical and technical sciences. In the first part there is mentioned statistical inference for a proportion. Here is written about classical, exact and Bayesian methods for estimating and hypothesis testing. If we have a large sample then we can approximate exact distribution by normal distribution but if we have a small sample cannot use this approximation and it is necessary to use discrete distribution which makes inference more complicated. The second part deals with two categorical variables analysis in contingency tables. Here are explained measures of association for 2 x 2 contingency tables such as difference of proportion and odds ratio and also presented how we can test independence in the case of large sample and small one. If we have small sample we are not allowed to use classical chi-squared tests and it is necessary to use alternative methods. This part contains variety of exact tests of independence and Bayesian approach for the 2 x 2 table too. In the end of this part there is written about a table for two dependent samples and we are interested whether two variables give identical results which occurs when marginal proportions are equal. In the last part there are methods used on data and discussed results.
Keywords:
Bayesian approach; Categorical data; Contingency tables; Exact methods; Proportion; Bayesovský přístup; Exaktní metody; Kategoriální data; Kontingenční tabulky; Relativní četnost
Institution: University of Economics, Prague
(web)
Document availability information: Available in the digital repository of the University of Economics, Prague. Original record: http://www.vse.cz/vskp/eid/26040