Národní úložiště šedé literatury Nalezeno 37 záznamů.  začátekpředchozí21 - 30další  přejít na záznam: Hledání trvalo 0.01 vteřin. 
Algoritmy pro detekci anomálií v datech z klinických studií a zdravotnických registrů
Bondarenko, Maxim ; Blaha, Milan (oponent) ; Schwarz, Daniel (vedoucí práce)
Daná diplomová práce se zabývá problematikou detekci anomálií v datech z klinických studií a zdravotnických registrů. Cílem práce je provedení literární rešerše problematiky kvality dat ve zdravotnickém výzkumu a realizace vlastního algoritmu detekce anomálních záznamů založeného na metodách strojového učení v reálných klinických datech z běžících nebo uzavřených klinických studií či registrů. V praktické části je popsán realizovaný algoritmus detekce, který se skládá z několika častí: import datového souboru z informačního systému, předzpracování a transformace importovaných datových záznamů s proměnnými různých datových typů na numerické vektory, využití známých statistických metod pro detekce outlierů a hodnoceni kvality a přesnosti algoritmu. Výsledkem zpracování algoritmu je vektor parametrů obsahujících anomálií, který má usnadnit práci správci dat. Tento algoritmus je navřen pro rozšíření palety funkcí informačního systému (CLADE-IS) o automatické monitorování kvality dat detekcí anomálních záznamů.
Algoritmy pro detekci anomálií v datech z klinických studií a zdravotnických registrů
Bondarenko, Maxim ; Blaha, Milan (oponent) ; Schwarz, Daniel (vedoucí práce)
Daná diplomová práce se zabývá problematikou detekci anomálií v datech z klinických studií a zdravotnických registrů. Cílem práce je provedení literární rešerše problematiky kvality dat ve zdravotnickém výzkumu a realizace vlastního algoritmu detekce anomálních záznamů založeného na metodách strojového učení v reálných klinických datech z běžících nebo uzavřených klinických studií či registrů. V praktické části je popsán realizovaný algoritmus detekce, který se skládá z několika častí: import datového souboru z informačního systému, předzpracování a transformace importovaných datových záznamů s proměnnými různých datových typů na numerické vektory, využití známých statistických metod pro detekce outlierů a hodnoceni kvality a přesnosti algoritmu. Výsledkem zpracování algoritmu je vektor parametrů obsahujících anomálií, který má usnadnit práci správci dat. Tento algoritmus je navřen pro rozšíření palety funkcí informačního systému (CLADE-IS) o automatické monitorování kvality dat detekcí anomálních záznamů.
Robustní regrese - identifikace odlehlých pozorování
Hradilová, Lenka ; Blatná, Dagmar (vedoucí práce) ; Černý, Jindřich (oponent)
Diplomová práce je zaměřena na metody identifikace odlehlých pozorování. Cílem této práce je posouzení vhodnosti využití robustních metod na reálných datech společnosti EKO-KOM, a.s. První část práce poskytuje celkový přehled a teoretický poklad, týkající se klasických a robustních metod identifikace odlehlých pozorování. Tyto metody jsou následně v praktické části aplikovány na obdržený datový soubor společnosti EKO-KOM, a.s. V závěru práce je na základě srovnání jednotlivých metod provedeno doporučení, které z metod, jsou pro analýzy dané společnosti vhodnější.
Stable distributions and their applications
Volchenkova, Irina ; Klebanov, Lev (vedoucí práce) ; Beneš, Viktor (oponent)
Cílem této práce je ukázat, že použití rozdělení s těžkými chvosty ve financích je teoreticky neodůvodněné a může způsobit značné nedorozumění a omyly v interpretaci modelu. Hlavním důvodem toho je nesprávná interpretace termínu chvost rozdělení. V modelech založených na skutečných datech je rozumnější zaměřit se na centrální části rozdělení a ne na jeho chvostech. Powered by TCPDF (www.tcpdf.org)
Robustification of statistical and econometrical regression methods
Jurczyk, Tomáš ; Víšek, Jan Ámos (vedoucí práce) ; Hlávka, Zdeněk (oponent) ; Malý, Marek (oponent)
Název práce: Robustifikace statistických a ekonometrických metod regrese Autor: Mgr. Tomáš Jurczyk Katedra: Katedra pravděpodobnosti a matematické statistiky Vedoucí disertační práce: prof. RNDr. Jan Ámos Víšek CSc., IES FSV UK Praha Abstrakt: Dva z problémů, které se mohou vyskytnout během regresní analýzy, jsou multikolinearita regresorů a přítomnost odlehlých pozorování. V této práci zkoumáme situace, kdy se v datech vyskytuje kombinace obou těchto problemů zároveň. Nejprve popíšeme, jak se v těchto případech chovají metody pro odhad regresních koeficientů navržených jen pro překonání jednoho z těchto problémů. Také prověříme funkčnost metod používanývh jako robustní detek- tory multikolinearity. Ukážeme, že navržené dvoukrokové metody (jejichž první krok je typicky založen na robustních odhadech regresních koeficientů) selhávají v odhalování odlehlých pozorování a tím pádem i multikolinearity, pokud je v nekontaminovaných datech přítomen vysoký stupeň multikolinearity. Navrhneme a představíme novou jednokrokovou metodu, která je kandidátem na robustní detektor multikolinearity a zároveň robustní hřebenovou regresi. Odvodíme její vlastnosti, popíšeme její chovaní a využití jako diagnostického...
Odlehlá pozorování
Kudrnáč, Vojtěch ; Zvára, Karel (vedoucí práce) ; Anděl, Jiří (oponent)
Tato práce se zabývá metodami identifikace odlehlých pozorování v jinak normálně rozděleném datovém souboru. Je zde popsáno několik významných testů a kritérií určených k tomuto účelu, Peirceovo kritérium, Chauvenetovo kritérium, Grubbsův test, Dixonův test a Cochranův test. U testů a kritérií je naznačeno jejich odvození a nakonec jsou zkoumány výsledky použití testů a kritérií na simulovaných datech s normálním rozdělením a vloženým odlehlým pozorováním. Součástí práce jsou i kódy v programovacím jazyce R s implementací těchto testů a kritérií s využitím už existujících funkcí. Powered by TCPDF (www.tcpdf.org)
Robust Regression Estimators: A Comparison of Prediction Performance
Kalina, Jan ; Peštová, Barbora
Regression represents an important methodology for solving numerous tasks of applied econometrics. This paper is devoted to robust estimators of parameters of a linear regression model, which are preferable whenever the data contain or are believed to contain outlying measurements (outliers). While various robust regression estimators are nowadays available in standard statistical packages, the question remains how to choose the most suitable regression method for a particular data set. This paper aims at comparing various regression methods on various data sets. First, the prediction performance of common robust regression estimators are compared on a set of 24 real data sets from public repositories. Further, the results are used as input for a metalearning study over 9 selected features of individual data sets. On the whole, the least trimmed squares turns out to be superior to the least squares or M-estimators in the majority of the data sets, while the process of metalearning does not succeed in a reliable prediction of the most suitable estimator for a given data set.
Robust Regularized Discriminant Analysis Based on Implicit Weighting
Kalina, Jan ; Hlinka, Jaroslav
In bioinformatics, regularized linear discriminant analysis is commonly used as a tool for supervised classification problems tailormade for high-dimensional data with the number of variables exceeding the number of observations. However, its various available versions are too vulnerable to the presence of outlying measurements in the data. In this paper, we exploit principles of robust statistics to propose new versions of regularized linear discriminant analysis suitable for highdimensional data contaminated by (more or less) severe outliers. The work exploits a regularized version of the minimum weighted covariance determinant estimator, which is one of highly robust estimators of multivariate location and scatter. The performance of the novel classification methods is illustrated on real data sets with a detailed analysis of data from brain activity research.
Plný tet: v1241-16 - Stáhnout plný textPDF
Plný text: content.csg - Stáhnout plný textPDF
Diagnostics for Robust Regression: Linear Versus Nonlinear Model
Kalina, Jan
Robust statistical methods represent important tools for estimating parameters in linear as well as nonlinear econometric models. In contrary to the least squares, they do not suffer from vulnerability to the presence of outlying measurements in the data. Nevertheless, they need to be accompanied by diagnostic tools for verifying their assumptions. In this paper, we propose the asymptotic Goldfeld-Quandt test for the regression median. It allows to formulate a natural procedure for models with heteroscedastic disturbances, which is again based on the regression median. Further, we pay attention to nonlinear regression model. We focus on the nonlinear least weighted squares estimator, which is one of recently proposed robust estimators of parameters in a nonlinear regression. We study residuals of the estimator and use a numerical simulation to reveal that they can be severely heteroscedastic also for data generated from a model with homoscedastic disturbances. Thus, we give a warning that standard residuals of the robust nonlinear estimator may produce misleading results if used for the standard diagnostic tools
On Exact Heteroscedasticity Testing for Robust Regression
Kalina, Jan ; Peštová, Barbora
The paper is devoted to the least weighted squares estimator, which is one of highly robust estimators for the linear regression model. Novel permutation tests of heteroscedasticity are proposed. Also the asymptotic behavior of the permutation test statistics of the Goldfeld-Quandt and Breusch-Pagan tests is investigated. A numerical experiment on real economic data is presented, which also shows how to perform a robust prediction model under heteroscedasticity.

Národní úložiště šedé literatury : Nalezeno 37 záznamů.   začátekpředchozí21 - 30další  přejít na záznam:
Chcete být upozorněni, pokud se objeví nové záznamy odpovídající tomuto dotazu?
Přihlásit se k odběru RSS.