Original title:
Kross-validace a její využití ve statistice
Translated title:
Cross-validation and its use in statistics
Authors:
Kossumov, Aibat ; Omelka, Marek (advisor) ; Hušková, Marie (referee) Document type: Master’s theses
Year:
2024
Language:
eng Abstract:
[eng][cze] In this thesis, the use of cross-validation methods in different areas of statistics is studied. Firstly, the application of leave-one-out cross- validation, CV(1), for bandwidth selection in kernel density estimation and kernel regression tasks is considered. Theoretical findings are demonstrated on simulated data. Then, the selection of a linear model with the best predictive ability is explored. It is illustrated that, in the context of linear models, the use of CV(nv) instead of the leave-one-out approach is advisable, where nv/n → 1 as n → ∞. The studied methods are applied on real data from parliamentary and presidential elections in the Czech Republic in 2021 and 2023. 1V této práci je zkoumáno použití metod křížové validace v různých oblastech statistiky. Nejprve se zaměřujeme na použití tzv. metody leave-one-out cross-validation, CV(1), pro volbu vyhlazovacích parametrů v jádrovém odhadu hustoty a úlohách jádrové regrese. Teoretické výsledky jsou demonstrovány na simulovaných datech. Dále se zabýváme výběrem lineárního modelu s nejlepší predikční schopností. Dokážeme, že v kontextu lineárních modelů je vhodné použít CV(nv) místo metody CV(1), kde nv/n → 1 pro n → ∞. Použijeme studované metody na reálná data z parlamentních a prezi- dentských voleb, které proběhly v České republice v letech 2021 a 2023. 1
Keywords:
cross-validation|kernel density estimation|nonparametric kernel regression|linear model; křížová validace|jádrové odhady hustoty|neparametrická jádrová regrese|lineární model
Institution: Charles University Faculties (theses)
(web)
Document availability information: Available in the Charles University Digital Repository. Original record: http://hdl.handle.net/20.500.11956/190559