Original title:
Využití metod dolování dat pro analýzu sociálních sítí
Translated title:
Using of Data Mining Method for Analysis of Social Networks
Authors:
Novosad, Andrej ; Očenášek, Pavel (referee) ; Bartík, Vladimír (advisor) Document type: Master’s theses
Year:
2013
Language:
cze Publisher:
Vysoké učení technické v Brně. Fakulta informačních technologií Abstract:
[cze][eng]
Práce se zabývá problematikou dolování dat v prostředí sociálních sítí. Podává přehled o dolování z dat a možných metodách dolování. Práce také zkoumá sociální média a sítě, co mohou poskytnout a jaké problémy se sebou přinášejí. Jsou prozkoumané API třech sociálních sítí a jejich možnosti z hlediska získání dat vhodných pro dolování. Zkoumají se techniky dolování znalostí z textových dat. Je popsán způsob implementace webové aplikace, která doluje data ze sociální sítě Twitter pomoci algoritmu SVM. Implementovaná aplikace klasifikuje zprávy na základě jejich textu do tříd reprezentujících kontinenty původu. Je provedeno několik experimentů v softwaru RapidMiner a v implementované webové aplikaci a jejich výsledky jsou prozkoumány.
Thesis discusses data mining the social media. It gives an introduction about the topic of data mining and possible mining methods. Thesis also explores social media and social networks, what are they able to offer and what problems do they bring. Three different APIs of three social networking sites are examined with their opportunities they provide for data mining. Techniques of text mining and document classification are explored. An implementation of a web application that mines data from social site Twitter using the algorithm SVM is being described. Implemented application is classifying tweets based on their text where classes represent tweets' continents of origin. Several experiments executed both in RapidMiner software and in implemented web application are then proposed and their results examined.
Keywords:
API; Data mining; document classification; Facebook; JavaScript; JSON; k-nearest neighbors; Last.fm; MySQL; Naive Bayes; Nette; OAuth; Phirehose; PHP; RapidMiner; social graph; social media; social networks; support vector machine; SVM; text mining; TF-IDF; Twitter; API; Dolování z dat; dolování z textových dat; Facebook; JavaScript; JSON; k-nejbližší sousedé; klasifikace dokumentů; Last.fm; MySQL; Naivní Bayes; Nette; OAuth; Phirehose; PHP; RapidMiner; sociálni graf; sociální médiá; sociální sítě; support vector machine; SVM; TF-IDF; Twitter
Institution: Brno University of Technology
(web)
Document availability information: Fulltext is available in the Brno University of Technology Digital Library. Original record: http://hdl.handle.net/11012/53567