Original title:
Neurčitost spojená s designem sběru dat v modelech druhové distribuce
Translated title:
Uncertainty associated with survey design in species distribution models
Authors:
Vrabeľ, Matej ; Moudrý, Vítězslav (advisor) ; Barták, Vojtěch (referee) Document type: Master’s theses
Year:
2017
Language:
cze Publisher:
Česká zemědělská univerzita v Praze Abstract:
[cze][eng] Vhodne zvolené vstupné dáta, ich forma, spôsob zberu, ako aj následná úprava, predstavujú kľúčový faktor ovplyvňujúci presnosť stále populárnejších modelov druhovej distribúcie (SDM). Testovaný bol vplyv designu zberu dát na vybraný model distribúcie virtuálneho druhu. Použitý bol zobecnený lineárny model (GLM). Testované boli 4 typy designu zberu prezenčne-absenčných dát virtuálneho druhu na území ČR: náhodný, systematický, body v ľahko prístupných oblastiach (okolie komunikácií) a body so zvýšnou koncentráciou vedeckých pracovníkov (územie CHKO). Pre porovnanie presnosti predpovede modelov boli použité hodnoty TSS (True skill statistics), KAPPA a AUC (Area under the curve). Body vybrané z ľahko prístupných oblastí a CHKO mali vo všetkých sledovaných hodnotách horšie výsledky ako náhodný alebo systematický výber bodov z celého územia ČR. Z výsledkov vyplýva, že typ zberu dát má preukázateľný vplyv na výslednú presnosť modelov druhovej distribúcie. Properly choosen input data, their form, way of the collection an the following correction as well, are the key factors affecting the accuracy of the more and more popular models of the species model distribution (SDM). A design unfluence of the data to the choosen distribution model of the virtual species has been tested. The General Linear Model (GLM) has been used. Four types of the present-absent collection designs have been tested for a virtual species on the area of the Czech Republic as follows: accidental, systematic, points on the easy accessible areas (near the communications) and the points with the higher concentration of the scientists (an area of CHKO).The TSS (True skills statistics), KAPPA and AUC (Area under curve) have been used to compare the accuracy of the prediction of the models .The points being choosen from the easy to access areas and CHKO had worse results in all of the monitored values than the accidental or the systematic choice of the points from the whole area of the Czech Republic.It results that the data collection mode affects the final accuracy of the species distribution models.
Keywords:
AUC; GLM; merítko; SDM; virtuální druh