Original title:
Sémantické rozpoznávání komentářů na webu
Translated title:
Semantic Recognition of Comments on the Web
Authors:
Stříteský, Radek ; Harár, Pavol (referee) ; Povoda, Lukáš (advisor) Document type: Master’s theses
Year:
2017
Language:
cze Publisher:
Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií Abstract:
[cze][eng]
Hlavním cílem semestrálního projektu je rozpoznávání komentářů na webových strán- kách. Teoretická část je zaměřena na umělou inteligenci, zejména se zde popisují klasi- fikátory. Praktická část se věnuje sestavení trénovací databáze, která se vytváří pomocí generátorů příznaků. Vygenerovaný příznak může být například název HTML elementu, ve kterém se nachází komentář. Vstupem klasifikátorů je vytvořená trénovací databáze. Výsledkem práce je testování klasifikátorů v programu RapidMiner.
The main goal of this paper is the identification of comments on internet websites. The theoretical part is focused on artificial intelligence, mainly classifiers are described there. The practical part deals with creation of training database, which is formed by using generators of features. A generated feature might be for example a title of the HTML element where the comment is. The training database is created by input of classifiers. The result of this paper is testing classifiers in the RapidMiner program.
Keywords:
classification; decision tree; Java; JSOUP; K-NN; random forest; RapidMiner; Java; JSOUP; K-NN; klasifikace; náhodný prales; RapidMiner; rozhodovací strom
Institution: Brno University of Technology
(web)
Document availability information: Fulltext is available in the Brno University of Technology Digital Library. Original record: http://hdl.handle.net/11012/65882