Název:
Webový portál pro správu a klasifikaci informací z distribuovaných zdrojů
Překlad názvu:
Web Application for Managing and Classifying Information from Distributed Sources
Autoři:
Vrána, Pavel ; Chmelař, Petr (oponent) ; Drozd, Michal (vedoucí práce) Typ dokumentu: Diplomové práce
Rok:
2011
Jazyk:
cze
Nakladatel: Vysoké učení technické v Brně. Fakulta informačních technologií
Abstrakt: [cze][eng]
Tato diplomová práce se zabývá technikami dolování dat a jejich klasifikací do kategorií dle kriterií. Cílem práce je implementace webového portálu pro správu a klasifikaci dat z distribuovaných zdrojů. K dosažení cíle bude třeba otestovat rozdílné metody a najít nejvhodnější z nich pro klasifikaci internetových článků. Ze získaných výsledků bude navržena maximálně automatizovaná aplikace pro stahování a klasifikaci dat z různých internetových zdrojů, která by v konečném důsledku měla nahradit uživatele, jež by tuto práci prováděl manuálně.
This master's thesis deals with data mining techniques and classification of the data into specified categories. The goal of this thesis is to implement a web portal for administration and classification of data from distributed sources. To achieve the goal, it is necessary to test different methods and find the most appropriate one for web articles classification. From the results obtained, there will be developed an automated application for downloading and classification of data from different sources, which would ultimately be able to substitute a user, who would process all the tasks manually.
Klíčová slova:
5A; CRISP-DM; Dolování dat; Drupal; K-NN; metodologie dolování dat; Naive Bayes; PHP Simple HTML DOM Parser.; RapidMiner; SEMMA; Support vector machine; SVM; webové aplikace; 5A; CRISP-DM; Data mining; data mining metodology; Drupal; K-NN; Naive Bayes; PHP Simple HTML DOM Parser.; RapidMiner; SEMMA; Support vector machine; SVM; web applications
Instituce: Vysoké učení technické v Brně
(web)
Informace o dostupnosti dokumentu:
Plný text je dostupný v Digitální knihovně VUT. Původní záznam: http://hdl.handle.net/11012/54186