Název:
Evaluace geografickeho Random Forest algoritmu v posouzení sucha
Překlad názvu:
Geographical Random Forest model evaluation in agricultural drought assessment
Autoři:
Bicák, Daniel ; Brodský, Lukáš (vedoucí práce) ; Brůha, Lukáš (oponent) Typ dokumentu: Diplomové práce
Rok:
2021
Jazyk:
eng
Abstrakt: [eng][cze] Drought is a natural disaster, which negatively affects millions of people and causes huge economic losses. This thesis investigates agricultural drought in Czechia using machine learning algorithms. The statistical models utilised were Random Forest (RF), Geographical Random Forest (GRF) and Locally Tuned Geographical Random Forest (LT GRF). GRF consists of several RF models trained on a subset of original data. The final prediction is a weighted sum of the prediction of a local and global model. The size of the subset is determined by the tunable parameter. LT GRF addresses spatial variability of subset size and local weight. During the tuning process, optimal parameters are found for every location and then interpolated for unknown regions. The thesis aims to evaluate the performance of each model and compare GRF feature importance output with the global model. The best model features meteorological impor- tances are used to create a drought vulnerability map of Czechia. Produced assessment is compared to existing drought vulnerability projects. 1Sucho je přírodní katastrofa, která negativně ovlivňuje miliony lidí a způsobuje obrovské ekonomické ztráty. Tato práce zkoumá zemědělské sucho v Česku pomocí algoritmů strojového učení. Použité statistické modely byly Random Forest (RF), Geographic Random Forest (GRF) a Locally Tuned Geographic Random Forest (LT GRF). GRF se skládá z několika RF modelů vytréno- vaných na podmnožinu původních dat. Konečná predikce je váženým součtem predikce lokálního a globálního modelu. Velikost podmnožiny je určena laditel- ným parametrem. LT GRF řeší prostorovou variabilitu velikosti podmnožiny a lokální váhu. Během procesu ladění jsou pro každé místo nalezeny optimální parametry a poté interpolovány pro neznámé oblasti. Tato práce si klade za cíl vyhodnotit přesnost každého modelu a porovnat výstup důležitosti faktorů GRF s globálním modelem. K vytvoření mapy zranitelnosti vůči suchu v Česku se využije důležitost meteorologických faktorů. Vytvořené hodnocení je porovnáno se stávajícími projekty zranitelnosti suchem. 1
Klíčová slova:
Geographical Random Forest; posouzení zranitelnosti; sucho; drought; Geographical Random Forest; vulnerability assessment