Original title:
Procedura SDKL - Miner pro dobývání znalostí z databází
Translated title:
Procedure SDKL-Miner for data mining
Authors:
Tegze, Miron ; Lín, Václav (referee) ; Rauch, Jan (advisor) Document type: Master’s theses
Year:
2007
Language:
cze Abstract:
[cze][eng] SDKL-Miner je nová GUHA procedura pro dobývání znalostí z databází. Rozšiřuje systém LISp-Miner, který je vyvíjen na VŠE Praha. SDKL-Miner hledá nové potencionálně zajímavé hypotézy pomocí dvojice kontingenčních tabulek. Do procedury SDKL-Miner byl implementován jednoduchý kvantifikátor. Diplomová práce obsahuje testy a nalezené zajímavé hypotézy pro jednoduchý kvantifikátor společně s příklady užití kvantifikátoru. V práci jsou navrženy směry dalšího vývoje, jak pro proceduru SDKL-Miner, tak i pro celý systém LISp-Miner. Použití statistických testů závislosti a použití vektorové i maticové majorizace je podrobně rozebráno. Procedura je výsledkem kontinuálního vývoje akademického systému LISp-Miner pro dobývání znalostí z databází.A new data mining GUHA procedure SDKL-Miner is presented which extends current data mining system LISp-Miner developed on the VŠE Praha. The procedure mines for various patterns based on evaluation of two two-dimensional contingency tables. A simple comparing quantifier is implemented. Tests and new results for this quantifier are presented together with set of examples of it's use. New directions of future development are proposed. The use of statistical dependency tests and the use of both vector and matrix majorization are analyzed in more details. The procedure is a result of continued development of the academic LISp-Miner system for knowledge discovery and data mining.
Institution: Charles University Faculties (theses)
(web)
Document availability information: Available in the Charles University Digital Repository. Original record: http://hdl.handle.net/20.500.11956/13249