Original title:
Modelování cen nemovitostí se zaměřením na vlastnosti lokality
Translated title:
Real estate price modelling with a focus on location attributes
Authors:
Charvát, Ondřej ; Polák, Petr (advisor) ; Hejlová, Hana (referee) Document type: Master’s theses
Year:
2020
Language:
eng Abstract:
[eng][cze] The thesis introduces several methods of real estate price modelling suitable either for prediction of the housing prices or for exploring the relationships between the price and its determinants. We compared the conventional linear regression approach to the tree-based methods of machine learning. The comparison analysis on the dataset of 28 019 apartments in Prague suggests that regression trees (especially the Random forest) yield a higher accuracy in the price prediction. Another objective was to examine the effects of location attributes (especially its accessibility and environmental quality) on the prices of nearby apartments. To address the spatial interactions in the geographical data, we employed three spatially conscious models to achieve more reliable results. The local analysis performed with the geographically weighted regression confirmed the presence of spatial heterogeneity and described the price effects relative to the location. In some areas, an increase of 100 meters in distance from the nearest metro station and the nearest park are associated with a decrease in the apartment prices by 644 CZK/m2 and 916 CZK/m2 , respectively. These findings are especially important for the apartments near the stations of the new metro line, which is currently in construction.Práce představuje několik metod modelování cen nemovitostí vhodných pro predikci cen bydlení nebo pro zkoumání vztahů mezi cenou a jejími určujícími faktory. Srovnali jsme konvenční lineární regresi se stromovými metodami strojového učení. Srovnávací analýza datové sady 28 019 bytů v Praze naznačuje, že regresní stromy (zejména náhodné lesy) poskytují vyšší přesnost při predikci cen. Dalším cílem této práce bylo prozkoumat účinky vlastností lokality (zejména její dostupnost a kvalita životního prostředí) na ceny blízkých bytů. K řešení prostorových interakcí v geografických datech jsme použili tři prostorově orientované modely, abychom dosáhli spolehlivějších výsledků. Lokální analýza provedená s geograficky váženou regresí odhalila prostorové interakce a popsala rozdílnost cenových faktorů v závislosti na lokalitě. V některých oblastech je zvýšení vzdálenosti od nejbližší stanice metra a nejbližšího parku spojeno se snížením cen bytů o 644 Kč/m2 a 916 Kč/m2 . Tato zjištění jsou zvláště důležitá pro byty v blízkosti stanic nové linky metra, která je v současné době ve výstavbě.
Keywords:
geographically weighted regression; hedonic price model; housing prices; machine learning; spatial analysis; ceny bydlení; geograficky vážená regrese; hedonický model; prostorová analýza; strojové učení
Institution: Charles University Faculties (theses)
(web)
Document availability information: Available in the Charles University Digital Repository. Original record: http://hdl.handle.net/20.500.11956/121317