Original title:
Generování dat pomocí modulu LM Reverse-Miner
Translated title:
Generating data using the LM Reverse-Miner
Authors:
Stluka, Jakub ; Šimůnek, Milan (advisor) ; Kliegr, Tomáš (referee) Document type: Master’s theses
Year:
2012
Language:
cze Publisher:
Vysoká škola ekonomická v Praze Abstract:
[cze][eng] Evolučním algoritmům je v posledních letech věnována velká pozornost, za tu dobu našly využití v široké škále oblastí, také dobývání znalostí z databází je již mnoho let velmi poptávaným produktem mnoha komerčních firem, a právě tyto dvě oblasti práce kombinuje. Předmětem je testování možností nového modulu Reverse-Miner, který slouží pro generování dat se skrytými vlastnostmi pomocí evolučních algoritmů, přitom využívá další moduly systému LISp-Miner, který je běžně používán pro dobývání znalostí z databází. Hlavní cíl představuje vygenerování dvou databází modulem tak, aby odpovídaly přesně stanoveným požadavkům, v práci jsou stanoveny i vedlejší cíle v podobě pochopení dané problematiky, která je důležitá pro následující modelování. Výsledkem praktické části práce jsou krom dvou úspěšně vygenerovaných databází i popsané kroky, metody a techniky, kterými se k těmto databázím došlo. Ze zkušeností z modelování a řešení vzniklých problémů jsou poté vyvozeny obecná doporučení na přípravu dat modulem Reverse-Miner. Předešlé výstupy navíc doplňují závěry analýzy využívaných technických prostředků při generování a návrhy několika možných rozšíření do budoucna.In past years, great attention has been paid to evolutionary algorithms and they have been utilized in wide range of industries including data mining field, which nowadays presents a highly demanded product for many commercial institutions. Both mentioned topics are combined in this work. Main thesis subject is testing of new Reverse-Miner module, which can generate data with hidden properties using evolutionary algorithms while using also other modules of LISp-Miner system, commonly used for the purposes of data mining. Main goal lies in generation of two databases by the module in such way so they would meet explicitly set requirements. Other goals are also set within the thesis in the form of understanding the domain necessary for subsequent modeling. The result of the practical part of the thesis is represented not only by two successfully generated databases, but also by description of steps, methods and techniques used. The common recommendations for data preparation by module Reverse-Miner are later summarized, based on experience with modeling. Previous thesis outputs are furthermore contemplating the conclusion of analysis of technical means used for generation and they also provide several suggestions for possible future extensions.
Keywords:
Data Mining; Evolutionary Algorithms; LISp-Miner; Reverse-Miner; dobývání znalostí z databází; evoluční algoritmy; LISp-Miner; Reverse-Miner
Institution: University of Economics, Prague
(web)
Document availability information: Available in the digital repository of the University of Economics, Prague. Original record: http://www.vse.cz/vskp/eid/34805