Název:
Distribuované zpracování rozsáhlých dat na platformě Java
Překlad názvu:
Distributed Big Data Processing on the Java Platform
Autoři:
Tutko, Jakub ; Rychlý, Marek (oponent) ; Burget, Radek (vedoucí práce) Typ dokumentu: Diplomové práce
Rok:
2018
Jazyk:
cze
Nakladatel: Vysoké učení technické v Brně. Fakulta informačních technologií
Abstrakt: [cze][eng]
Táto práca sa zameriava na možnosti distribuovaného spracovania rozsiahlych dát na platforme Java s využitím grafových databáz. Analyzuje niekoľko distribúcii grafových databáz a spôsob ich prepojenia so systémom pre distribuované spracovanie dát, Apache Hadoop. Pre testovanie efektivity jednotlivých databázových riešení je výsledkom práce aplikácia, ktorá sťahuje dáta zo sociálnych sietí Twitter a Facebook. Tieto dáta je potom schopná zapísať a analyzovať pomocou dvoch rôznych databázových frameworkov. Jedná sa o frameworky Halyard a HGraphDB.
This thesis is focused on the distributed Big Data processing on the Java platform, together with graph databases. It analyses several graph database distributions and the possibilities to connect them to the Apache Hadoop system for distributed data processing. For the purpose of testing database solutions effectiveness, the thesis outcome is an application, which is downloading data from social networks Twitter and Facebook. It is able to write and analyse data with two different database frameworks which are Halyard and HGraphDB.
Klíčová slova:
distribuovaná databáza; grafová databáza; Hadoop; Halyard; HBase; HGraphDB; JanusGraph; Neo4j; property graf; RDF; RDF4J; Spark; distributed database; graph database; Hadoop; Halyard; HBase; HGraphDB; JanusGraph; Neo4j; property graph; RDF; RDF4J; Spark
Instituce: Vysoké učení technické v Brně
(web)
Informace o dostupnosti dokumentu:
Plný text je dostupný v Digitální knihovně VUT. Původní záznam: http://hdl.handle.net/11012/84950