Original title:
Metody dolování sekvenčních vzorů
Translated title:
Methods for Mining Sequential Patterns
Authors:
Fekete, Martin ; Burgetová, Ivana (referee) ; Bartík, Vladimír (advisor) Document type: Bachelor's theses
Year:
2021
Language:
slo Publisher:
Vysoké učení technické v Brně. Fakulta informačních technologií Abstract:
[slo][eng]
Dolovanie sekvenčných vzorov je oblasť dolovania z dát so širokým využitím. V súčasnosti existuje množstvo algoritmov a prístupov k problému dolovania sekvenčných vzorov. Cieľom tejto práce je navrhnúť a implementovať aplikáciu určenú na dolovanie sekvenčných vzorov a pomocou nej experimentálne porovnať zvolené algoritmy. Experimenty sú vykonávané ako so syntetickými, tak aj s reálnymi databázami. Výstupom práce je zhrnutie výhod a nevýhod jednotlivých algoritmov pre rôzne druhy vstupných databáz a aplikácia implementujúca vybrané algoritmy knižnice SPMF.
Sequential pattern mining is a field of data mining with wide applications. Currently, there are a number of algorithms and approaches to the problem of sequential pattern mining. The aim of this work is to design and implement an application designed for sequential pattern mining and use it to experimentally compare the chosen algorithms. Experiments are performed with both synthetic and real databases. The output of the work is a summary of the advantages and disadvantages of each algorithm for different kinds of input databases and an application implementing the selected algorithms of the SPMF library.
Keywords:
apriori; CM-SPADE; CM-SPAM; data mining; early candidate pruning; GSP; knowledge discovery from databases; LAPIN; pattern growth; PrefixSpan; sequential pattern mining; sequential patterns; SPADE; SPAM; SPMF
Institution: Brno University of Technology
(web)
Document availability information: Fulltext is available in the Brno University of Technology Digital Library. Original record: http://hdl.handle.net/11012/199484