Original title:
Dolování víceúrovňových sekvenčních vzorů
Translated title:
Mining Multi-Level Sequential Patterns
Authors:
Šebek, Michal ; Platoš, Jan (referee) ; Popelínský, Lubomír (referee) ; Zendulka, Jaroslav (advisor) Document type: Doctoral theses
Year:
2017
Language:
eng Publisher:
Vysoké učení technické v Brně. Fakulta informačních technologií Abstract:
[eng][cze]
Dolování sekvenčních vzorů je důležitá oblast získávání znalostí z databází. Stále více průmyslových a obchodních aplikací uchovává data mající povahu sekvencí, kdy je dáno pořadí jednotlivých transakcí. Toho může být využito například při analýze po sobě jdoucích nákupů zákazníků. Tato práce se zabývá využitím hierarchického uspořádání položek při dolování sekvenčních vzorů. V rámci práce jsou řešeny dvě základní oblasti - dolování víceúrovňových sekvenčních vzorů s křížením a bez křížení úrovní hierarchií. Dolovací úlohy pro obě oblasti jsou v práci formalizovány a následně navrženy algoritmy hGSP a MLSP pro jejich řešení. Experimentálně bylo ověřeno, že především algoritmus MLSP dosahuje výborných výkonnostních vlastností a stability. Význam nově získaných vzorů je ukázán na dolování reálných produkčních dat.
Mining sequential patterns is a very important area of the data mining. Many industrial and business applications save sequential data where the ordering of transactions is defined. It can be used for example for analysis of consecutive shopping transactions. This thesis deals with the using of concept hierarchies of items for mining sequential patterns. This thesis focuses on two basic approaches - mining level-crossing sequential patterns and mining multi-level sequential patterns. The approaches for the both data mining tasks are formalized and there are proposed data mining algorithms hGSP and MLSP to solve these tasks. Experiments verified that mainly the MLSP has good performance and stability. The usability of newly obtained patterns is shown on the real-world data mining task.
Keywords:
dolování sekvenčních vzorů; konceptové hierarchie; uzavřené vzory; víceúrovňové sekvenční vzory; získávání znalostí z databází; closed patterns; concept hierarchies; data mining; level-crossing sequential patterns; mining sequential patterns; multi-level sequential patterns
Institution: Brno University of Technology
(web)
Document availability information: Fulltext is available in the Brno University of Technology Digital Library. Original record: http://hdl.handle.net/11012/187315