Original title:
Metody kontrukce klasifikátorů vhodných pro segmentaci zákazníků
Translated title:
Construction of classifiers suitable for segmentation of clients
Authors:
Hricová, Jana ; Antoch, Jaromír (advisor) ; Zvára, Karel (referee) Document type: Master’s theses
Year:
2013
Language:
slo Abstract:
[eng][cze] Title: Construction of classifiers suitable for segmentation of clients Author: Bc. Jana Hricová Department: Department of Probability and Mathematical Statistics Supervisor: prof. RNDr. Jaromír Antoch, CSc., Department of Probability and Mathematical Statistics Abstract: The master thesis discusses methods that are a part of the data analy- sis, called classification. In the thesis are presented classification methods used to construct tree like classifiers suitable for customer segmentation. Core methodo- logy that is discussed in our thesis is CART (Classification and Regression Trees) and then methodologies around ensemble models that use historical data to cons- truct classification and regression forests, namely Bagging, Boosting, Arcing and Random Forest. Here described methods were applied to real data from the field of customer segmentation and also to simulated data, both processed with RStudio software. Keywords: classification, tree like classifiers, random forestsNázev práce: Metody konstrukce klasifikátorů vhodných pro segmentaci zákaz- níků Autor: Bc. Jana Hricová Katedra: Katedra pravděpodobnosti a matematické statistiky Vedoucí diplomové práce: prof. RNDr. Jaromír Antoch, CSc., Katedra pravděpo- dobnosti a matematické statistiky Abstrakt: Diplomová práce pojednává o metodách, které jsou součástí široké ob- lasti analýzy dat, zvané klasifikace. V rámci klasifikačních metod jsou v práci představeny metody vhodné pro segmentaci zákazníků, které konstruují klasifiká- tory stromového typu. Podrobně je představena metodologie CART (Klasifikační a regresní stromy) a skupinové modely, vhodné pro konstrukci klasifikačních a re- gresních lesů, jmenovitě Bagging, Boosting, Arcing a Random Forest. Popsané metody byly použity na reálná data z oblasti segmentace zákazníků a na simulované data v prostředí programu RStudio. Klíčová slova: klasifikace, klasifikátory stromového typu, náhodné lesy
Keywords:
Classification; random forests; tree like and forest like classifiers; Klasifikace; klasifikátory stromového typu; náhodné lesy
Institution: Charles University Faculties (theses)
(web)
Document availability information: Available in the Charles University Digital Repository. Original record: http://hdl.handle.net/20.500.11956/58592