Original title:
Předpovídání výsledků tenisových zápasů. Jak důležitý je faktor různých povrchů?
Translated title:
Predicting the outcomes of tennis matches. How important is the factor of different surfaces?
Authors:
Sklenička, Jan ; Kurka, Josef (advisor) ; Palanský, Miroslav (referee) Document type: Bachelor's theses
Year:
2024
Language:
eng Abstract:
[eng][cze] This thesis focuses on predicting the outcomes of ATP tennis matches with the aim of investigating the effect of different tennis surfaces. We define nine surface variables based on two different clustering methods, and incorporate these variables into models that were estimated using logistic regression. Such approach allows us to robustly observe how the effect of specializing on a spe- cific surface translates into the match winning probability. The accuracy of the models ranges from 63% to 65%, with the models incorporating the effect of surface specialization displaying a superior predictive accuracy. Based on several evaluation metrics, the results confirm that surface specialization is a crucial variable when predicting tennis matches. We are also able to identify that the most accurate metric to measure surface specialization is the difference in normalized winning rate. Moreover, the analysis reveals that the specializa- tion on grass courts is the most important compared to clay or hard courts. Lastly, we formalize betting strategies based on the predicted probabilities from the models, and we are able to achieve positive out-of-sample return on invest- ment (ROI). Accounting for the effect of surface specialization increases ROI on the non-naive betting strategies. JEL Classification...Tato práce se zaměřuje na předpovídání výsledků ATP zápasů v tenise s cílem prozkoumat důležitost tenisových povrchů. Pro analýzu bylo definováno devět nových povrchových proměnných na základě dvou různých klastrových method. Tyto proměnné byly začleněny do modelů, které byly následně odhadnuty po- mocí logistické regrese. Takový přístup nám umožňuje robustně sledovat, jak se vliv specializace na konkrétní povrch promítá do pravděpodobnosti vítězství v zápase. Přesnost těchto modelů se pohybovala mezi 63% a 65%, přičemž modely zahrnující vliv specializace na povrch vykazují vyšší přesnost predikcí. Na základě několika hodnotících metrik výsledky potvrzují, že specializace na povrch je při předpovídání tenisových zápasů klíčovou proměnnou. Jsme také schopni určit, že nejpřesnější metrikou pro měření specializace povrchu je rozdíl v normalizované procentuální úspěšnosti na daném povrchu. Analýza navíc ukazuje, že specializace na travnaté kurty je ve srovnání s antukovými nebo tvrdými kurty nejdůležitější. Nakonec definujeme sázkové strategie založené na předpovězených pravděpodobnostech z modelů a jsme schopni dosáhnout kladné návratnosti investic (ROI). Zohlednění vlivu specializace na povrch zvyšuje ROI u nenaivních sázkových strategií. Klasifikace JEL C10, C38, C53, L83 Klíčová slova tenis,...
Keywords:
ATP; betting odds; logistic regression; predicting matches; tennis; ATP; logistická regrese; předpovídaní zápasů; sázkové kurzy; tenis
Institution: Charles University Faculties (theses)
(web)
Document availability information: Available in the Charles University Digital Repository. Original record: http://hdl.handle.net/20.500.11956/190596