Original title:
Webový portál pro správu a klasifikaci informací z distribuovaných zdrojů
Translated title:
Web Application for Managing and Classifying Information from Distributed Sources
Authors:
Vrána, Pavel ; Chmelař, Petr (referee) ; Drozd, Michal (advisor) Document type: Master’s theses
Year:
2011
Language:
cze Publisher:
Vysoké učení technické v Brně. Fakulta informačních technologií Abstract:
[cze][eng]
Tato diplomová práce se zabývá technikami dolování dat a jejich klasifikací do kategorií dle kriterií. Cílem práce je implementace webového portálu pro správu a klasifikaci dat z distribuovaných zdrojů. K dosažení cíle bude třeba otestovat rozdílné metody a najít nejvhodnější z nich pro klasifikaci internetových článků. Ze získaných výsledků bude navržena maximálně automatizovaná aplikace pro stahování a klasifikaci dat z různých internetových zdrojů, která by v konečném důsledku měla nahradit uživatele, jež by tuto práci prováděl manuálně.
This master's thesis deals with data mining techniques and classification of the data into specified categories. The goal of this thesis is to implement a web portal for administration and classification of data from distributed sources. To achieve the goal, it is necessary to test different methods and find the most appropriate one for web articles classification. From the results obtained, there will be developed an automated application for downloading and classification of data from different sources, which would ultimately be able to substitute a user, who would process all the tasks manually.
Keywords:
5A; CRISP-DM; Data mining; data mining metodology; Drupal; K-NN; Naive Bayes; PHP Simple HTML DOM Parser.; RapidMiner; SEMMA; Support vector machine; SVM; web applications; 5A; CRISP-DM; Dolování dat; Drupal; K-NN; metodologie dolování dat; Naive Bayes; PHP Simple HTML DOM Parser.; RapidMiner; SEMMA; Support vector machine; SVM; webové aplikace
Institution: Brno University of Technology
(web)
Document availability information: Fulltext is available in the Brno University of Technology Digital Library. Original record: http://hdl.handle.net/11012/54186