Original title:
Distribuované zpracování rozsáhlých dat na platformě Java
Translated title:
Distributed Big Data Processing on the Java Platform
Authors:
Tutko, Jakub ; Rychlý, Marek (referee) ; Burget, Radek (advisor) Document type: Master’s theses
Year:
2018
Language:
cze Publisher:
Vysoké učení technické v Brně. Fakulta informačních technologií Abstract:
[cze][eng]
Táto práca sa zameriava na možnosti distribuovaného spracovania rozsiahlych dát na platforme Java s využitím grafových databáz. Analyzuje niekoľko distribúcii grafových databáz a spôsob ich prepojenia so systémom pre distribuované spracovanie dát, Apache Hadoop. Pre testovanie efektivity jednotlivých databázových riešení je výsledkom práce aplikácia, ktorá sťahuje dáta zo sociálnych sietí Twitter a Facebook. Tieto dáta je potom schopná zapísať a analyzovať pomocou dvoch rôznych databázových frameworkov. Jedná sa o frameworky Halyard a HGraphDB.
This thesis is focused on the distributed Big Data processing on the Java platform, together with graph databases. It analyses several graph database distributions and the possibilities to connect them to the Apache Hadoop system for distributed data processing. For the purpose of testing database solutions effectiveness, the thesis outcome is an application, which is downloading data from social networks Twitter and Facebook. It is able to write and analyse data with two different database frameworks which are Halyard and HGraphDB.
Keywords:
distributed database; graph database; Hadoop; Halyard; HBase; HGraphDB; JanusGraph; Neo4j; property graph; RDF; RDF4J; Spark; distribuovaná databáza; grafová databáza; Hadoop; Halyard; HBase; HGraphDB; JanusGraph; Neo4j; property graf; RDF; RDF4J; Spark
Institution: Brno University of Technology
(web)
Document availability information: Fulltext is available in the Brno University of Technology Digital Library. Original record: http://hdl.handle.net/11012/84950