Original title:
Implementace shlukování regulárních výrazů pomocí MapReduce přístupu
Translated title:
Implementation of Regular Expression Grouping in MapReduce Paradigm
Authors:
Šafář, Martin ; Dvořák, Milan (referee) ; Kaštil, Jan (advisor) Document type: Bachelor's theses
Year:
2014
Language:
cze Publisher:
Vysoké učení technické v Brně. Fakulta informačních technologií Abstract:
[cze][eng]
Hlavním přínosem této práce je návrh a implementace aplikace, která využívá model MapReduce a Apache Hadoop pro urychlení shlukování regulárních výrazů. V této prácí jsou popsány algoritmy, které se využívají pro shlukování regulárních výrazů a je navrženo několik vylepšení pro tyto algoritmy. Experimenty prováděné v rámci této práce ukázaly, že cluster skládající se z 20ti počítačů dokáže oproti klasickému přístupu zrychlit shlukování až desetinásobně.
The greatest contribution of this thesis is design and implementation of program, that uses MapReduce paradigm and Apache Hadoop for acceleration of regular expression grouping. This paper also describes algorithms, that are used for regular expression grouping and proposes some improvements for these algorithms. Experiments carried out in this thesis show, that a cluster of 20 computers can speed up the grouping ten times.
Keywords:
Hadoop; Intrusion Detection System; MapReduce; Regular expression grouping; Hadoop; Intrusion Detection System; MapReduce; Shlukování regulárních výrazů
Institution: Brno University of Technology
(web)
Document availability information: Fulltext is available in the Brno University of Technology Digital Library. Original record: http://hdl.handle.net/11012/53052