Název:
Využití metod dolování dat pro analýzu sociálních sítí
Překlad názvu:
Using of Data Mining Method for Analysis of Social Networks
Autoři:
Novosad, Andrej ; Očenášek, Pavel (oponent) ; Bartík, Vladimír (vedoucí práce) Typ dokumentu: Diplomové práce
Rok:
2013
Jazyk:
cze
Nakladatel: Vysoké učení technické v Brně. Fakulta informačních technologií
Abstrakt: [cze][eng]
Práce se zabývá problematikou dolování dat v prostředí sociálních sítí. Podává přehled o dolování z dat a možných metodách dolování. Práce také zkoumá sociální média a sítě, co mohou poskytnout a jaké problémy se sebou přinášejí. Jsou prozkoumané API třech sociálních sítí a jejich možnosti z hlediska získání dat vhodných pro dolování. Zkoumají se techniky dolování znalostí z textových dat. Je popsán způsob implementace webové aplikace, která doluje data ze sociální sítě Twitter pomoci algoritmu SVM. Implementovaná aplikace klasifikuje zprávy na základě jejich textu do tříd reprezentujících kontinenty původu. Je provedeno několik experimentů v softwaru RapidMiner a v implementované webové aplikaci a jejich výsledky jsou prozkoumány.
Thesis discusses data mining the social media. It gives an introduction about the topic of data mining and possible mining methods. Thesis also explores social media and social networks, what are they able to offer and what problems do they bring. Three different APIs of three social networking sites are examined with their opportunities they provide for data mining. Techniques of text mining and document classification are explored. An implementation of a web application that mines data from social site Twitter using the algorithm SVM is being described. Implemented application is classifying tweets based on their text where classes represent tweets' continents of origin. Several experiments executed both in RapidMiner software and in implemented web application are then proposed and their results examined.
Klíčová slova:
API; Dolování z dat; dolování z textových dat; Facebook; JavaScript; JSON; k-nejbližší sousedé; klasifikace dokumentů; Last.fm; MySQL; Naivní Bayes; Nette; OAuth; Phirehose; PHP; RapidMiner; sociálni graf; sociální médiá; sociální sítě; support vector machine; SVM; TF-IDF; Twitter; API; Data mining; document classification; Facebook; JavaScript; JSON; k-nearest neighbors; Last.fm; MySQL; Naive Bayes; Nette; OAuth; Phirehose; PHP; RapidMiner; social graph; social media; social networks; support vector machine; SVM; text mining; TF-IDF; Twitter
Instituce: Vysoké učení technické v Brně
(web)
Informace o dostupnosti dokumentu:
Plný text je dostupný v Digitální knihovně VUT. Původní záznam: http://hdl.handle.net/11012/53567