Original title:
Využití strojového učení pro predikci odchodu zákazníka
Translated title:
Machine learning in customer churn prediction
Authors:
Fridrich, Martin ; Chramcov, Bronislav (referee) ; Lenort, Radim (referee) ; Šimberová, Iveta (referee) ; Dostál, Petr (advisor) Document type: Doctoral theses
Year:
2023
Language:
cze Publisher:
Vysoké učení technické v Brně. Fakulta podnikatelská Abstract:
[cze][eng]
Disertační práce se zaměřuje na predikci odchodu zákazníků v prostředí elektronického maloobchodu. Text představuje současný stav vědeckého bádání, analyzuje klíčové trendy a identifikuje příležitosti pro další výzkum. Literární rešerše je dílem realizována prostřednictvím metod pro zpracování přirozeného jazyka. Cílem práce je navrhnout, implementovat a zhodnotit systém strojového učení pro predikci odchodu zákazníků v elektronickém maloobchodě, který reflektuje perspektivy ekonomického dopadu navazujících retenčních aktivit a umožňuje bližší porozumění modelovanému jevu. Vlastní řešení je strukturováno do částí vymezení problému, porozumění a zpracování dat, modelování, vyhodnocení, interpretace a produkční nasazení systému. Nad rámec klasického pojetí odchodu zákazníka, jako absence transakce v budoucím období, je představeno nové pojetí inkrementálního ekonomického dopadu retenční kampaně. Přístupy jsou ověřeny na dvou datových souborech. V rámci modelování je uvažováno o GLM, SVM, ANN, rozhodovacích stromech a meta-algoritmech. Vnější parametry vlastního zpracování dat a konstrukce modelu jsou odhadnuty s pomocí Bayesovské optimalizace. Porozumění modelovaným jevům je podpořeno s pomocí SHAP nástrojů, které jsou rozšířeny v oblastech odhadu a vizuální prezentace. Z pohledu přirozených ukazatelů prediktivních schopností vyčnívají řešení využívající náhodné lesy nebo gradient boosting, v klasickém pojetí vynikají i ANN. Z hlediska ekonomického výsledku retenční aktivity vyčnívá nové pojetí úlohy, pozoruhodné jsou především systémy postavené na rozhodovacích stromech nebo meta-algoritmech. Jako klíčové nezávislé proměnné se podařilo identifikovat reprezentace stáří a frekvenci interakcí a transakcí, v novém pojetí vyčnívá i hodnota zákazníka. Určení a porozumění zákaznickým shlukům, na které je vhodné cílit, pak přímo podporuje související retenční aktivity. Disertační práce tak představuje ucelený přehled nových přístupů a nástrojů pro predikci odchodu zákazníka, využitelných jak pro další výzkum, tak v podnikové nebo pedagogické praxi.
The dissertation examines customer churn prediction in e-commerce retail settings, presenting the current research landscape, analyzing key trends, and pinpointing opportunities for further investigation. The literature review is conducted using language processing. The study aims to develop, implement, and evaluate a machine learning system for predicting customer churn in the e-commerce environment, considering the economic implications of retention efforts, and facilitating a deeper understanding of the modeled phenomenon. The solution is organized into sections covering problem definition, data comprehension and processing, model development, evaluation, interpretation, and deployment. The author extends the traditional concept of customer churn as the lack of a transaction in a future period with a novel idea of the incremental economic impact of a retention campaign. The notions are validated using two datasets. The modeling framework incorporates GLM, SVM, ANN, decision trees, and meta-algorithms. Bayesian optimization estimates external parameters related to data processing and model building. The understanding of the phenomena is enhanced using SHAP tools, which are improved in terms of computation and visual representation. From the perspective of natural prediction performance, random forests and gradient boosting dominate; in the original task, ANN also performs well. When considering the financial results of the retention campaign, the novel approach functions excellently, mainly when coupled with decision trees or meta-learning. Recency and frequency representations of interactions and transactions are identified as key features; the feature importance of customer value emerges in the novel approach. Identifying and comprehending customer segments to target directly supports subsequent retention initiatives. In summary, the thesis offers an extensive overview of novel methods and tools for predicting customer churn, which can be valuable for future research and practical applications in business or educational settings.
Keywords:
customer churn prediction; customer relationship management; e-commerce retail; machine learning; retention management; elektronický maloobchod; predikce odchodu zákazníka; retenční řízení; strojové učení; řízení vztahů se zákazníky
Institution: Brno University of Technology
(web)
Document availability information: Fulltext is available in the Brno University of Technology Digital Library. Original record: http://hdl.handle.net/11012/244184