Original title:
Porovnávání cen v internetových obchodech
Translated title:
Comparing Prices in Internet Shops
Authors:
Koukola, Daniel ; Semecký, Jiří (referee) ; Spousta, Miroslav (advisor) Document type: Master’s theses
Year:
2008
Language:
cze Abstract:
[cze][eng] Tato práce se zabývá problémy systémů pro porovnávání cen v internetových obchodech. Zaměřuje se na metody automatické extrakce dat z webových stránek a metody klasifikace takto získaných dat. Je navrženo a implementováno několik algoritmů pro řešení těchto úloh. Navržen je i nový algoritmus automatické extrakce dat založený na metodách strojového učení s učitelem. Implementované metody jsou vyzkoušeny na testovacích datech a jsou nalezeny vhodné parametry použitých algoritmů.This work deals with problems of comparison shopping engines. It focuses on methods for automatic data extraction from web pages and methods for classification of the extracted data. Several algorithms for solving these problems are proposed and implemented. Also a new algorithm for automatic data extraction based on supervised machine learning techniques is proposed. Implemented methods are evaluated on a test data set and suitable parameters for the tested algorithms are found.
Institution: Charles University Faculties (theses)
(web)
Document availability information: Available in the Charles University Digital Repository. Original record: http://hdl.handle.net/20.500.11956/14851