Original title:
Predikce cen ojetých automobilů na Evropském trhu s použitím metod strojového učení
Translated title:
Price Prediction Using Machine Learning Methods on the European Market of Used Cars
Authors:
Dvořáček, Petr ; Baruník, Jozef (advisor) ; Vácha, Lukáš (referee) Document type: Master’s theses
Year:
2023
Language:
eng Abstract:
[eng][cze] This master's thesis proposes accurate predictions of the prices of used cars. It builds its fundamentals on the available research and broadens the academic literature by applying several modern techniques to the European market. Us- ing machine learning models and unique data, high accuracy of predictions was obtained. The precise prediction of the residual value of a used car might benefit both the buyers and the sellers, and also reduce market inefficiencies. We are not aware of any similar work in the particular field focusing on the European market. An application programming interface (API) was exploited in order to col- lect the data. Therefore, a large set of data consisting of 221,704 used car classifieds was gathered and used in various models (MLR, PCR, LASSO, De- cision Tree, Random Forests, and ANNs). This study aims to find the most precise model for estimating the prices of used cars with the help of several performance statistics (R2, RMSE, and MAE). We support the available lit- erature as the random forest approach provided the highest accuracy when predicting the used car prices. A model using ANNs seemed to be the second best in terms of predictive performances, however, required comparably much more computing power. The effects of various attributes of used vehicles on their...Tato diplomová práce poskytuje přesné predikce cen ojetých vozidel. Tato studie staví své základy na dostupných poznatcích a rozšiřuje akademickou literaturu svým zaměřením na evropský trh s ojetými automobily. Navíc je zde použito několik metod strojového učení a unikátní metoda sběru dat, díky kterým byla dosažena vysoká přesnost. Přesná predikce cen by měla být přínosná jak pro kupující, tak i pro prodávající. Měla by také zmírňovat neefek- tivity na trhu s ojetými automobily. Autor si není vědom žádné podobné práce se zaměřením na evropský trh ojetých automobilů. Aplikační programové rozhraní bylo využito pro sběr dat. Tímto způsobem byla získána obsáhlá datová sada tvořena 221 704 inzeráty ojetých automo- bilů. Tato datová sada byla následně použita jako vstup do několika ekonomet- rických modelů - mnohonásobné lineární regrese, regrese hlavních komponent, lasso regrese, rozhodovacího stromu, náhodných lesů a umělých neuronových sítí. Tato studie se pomocí několika statistických metrik pokouší najít model, který je schopný co nejpřesněji předpovědět zbytkovou cenu ojetého auta. Mezi tyto výkonnostní statistiky patří koeficient determinace, směrodatná odchylka chyb a střední absolutní odchylka. Tato studie je v souladu s dostupnou liter- aturou a z vybraných metod považuje techniku náhodných...
Keywords:
machine learning; price prediction; used cars; ojetá auta; predikce ceny; strojové učení
Institution: Charles University Faculties (theses)
(web)
Document availability information: Available in the Charles University Digital Repository. Original record: http://hdl.handle.net/20.500.11956/182499