Název:
Moderní regresní metody při dobývání znalostí z dat
Překlad názvu:
Modern regression methods in data mining
Autoři:
Kopal, Vojtěch ; Holeňa, Martin (vedoucí práce) ; Gemrot, Jakub (oponent) Typ dokumentu: Diplomové práce
Rok:
2015
Jazyk:
eng
Abstrakt: [eng][cze] The thesis compares several non-linear regression methods on synthetic data sets gen- erated using standard benchmarks for a continuous black-box optimization. For that com- parison, we have chosen the following regression methods: radial basis function networks, Gaussian processes, support vector regression and random forests. We have also included polynomial regression which we use to explain the basic principles of regression. The com- parison of these methods is discussed in the context of black-box optimization problems where the selected methods can be applied as surrogate models. The methods are evalu- ated based on their mean-squared error and on the Kendall's rank correlation coefficient between the ordering of function values according to the model and according to the function used to generate the data. 1Tato práce porovnává nelineární regresní metody na umělých datech vytvořených po- mocí standardních testovacích funkcí pro spojité black-box optimalizace. Pro toto srovnání jsme vybrali následující regresní metody: sítě s bázemi tvořenými radiálními funkcemi, Gaussovské procesy, regresi založenou na opěrných vektorech a náhodné lesy. Metody jsou porovnány v kontextu problémů black-box optimalizace, kde se právě tyto metody používají jako náhradní modely. Metody jsou vyhodnoceny na základě střední kvadratické chyby a na základě Kendallova koeficientu mezi pořadím funkčních hodnot podle modelu a podle funkce, která byla použita k vygenerování dat. 1
Klíčová slova:
Gaussovské procesy; nelineární regrese; náhodné lesy; sítě s bázemi tvořenými radiálními funkcemi; testovací funkce pro black-box optimalizaci; black-box optimization benchmarks; Gaussian processes; non-linear regression; radial basis function networks; random forests