Original title:
Dolování dat v prostředí sociálních sítí
Translated title:
Data Mining in Social Networks
Authors:
Raška, Jiří ; Očenášek, Pavel (referee) ; Bartík, Vladimír (advisor) Document type: Master’s theses
Year:
2013
Language:
cze Publisher:
Vysoké učení technické v Brně. Fakulta informačních technologií Abstract:
[cze][eng]
Tato práce se zabývala získáváním znalostí ze sociálních médií. Konkrétním cílem této práce bylo získávání názorů na úrovní rysů z uživatelských recenzí. V teoretické části byly uvedeny metody v procesu dolování názorů a zpracování přirozeného jazyka. Hlavní částí této práce byly návrh a implementace knihovny pro dolování názorů pomocí analyzátoru přirozeného jazyka Stanford Parser a lexikální databáze WordNet. Pro identi kaci rysů byla použita závislostní gramatika, implicitní rysy byly dolovány metodou CoAR a názory byly klasi kovány algoritmem typu učení s učitelem. Na závěr byly uvedeny experimenty vyhodnocující implementované řešení a příklady použití.
This thesis deals with knowledge discovery from social media. This thesis is focused on feature based opinion mining from user reviews. In theoretical part were described methods of opinion mining and natural language processing. Main parts of this thesis were design and implementation of library for opinion mining based on Stanford Parser and lexicon WordNet. For feature identi cation was used dependency grammar, implicit features were mined with method CoAR and opinions were classi ed with supervised algorithm. Finally were given experiments with implemented library and examples of usage.
Keywords:
.NET; data mining; natural language processing; opinion mining; social media; Stanford Parser; user reviews; WordNet; .NET; dolování dat; dolování názorů; sociální média; Stanford Parser; uživatelské recenze; WordNet; zpracování přirozeného jazyka
Institution: Brno University of Technology
(web)
Document availability information: Fulltext is available in the Brno University of Technology Digital Library. Original record: http://hdl.handle.net/11012/53552