Original title:
Získávání znalostí z textových dat
Translated title:
Knowledge Discovery in Text
Authors:
Smékal, Luděk ; Burget, Radek (referee) ; Bartík, Vladimír (advisor) Document type: Master’s theses
Year:
2007
Language:
cze Publisher:
Vysoké učení technické v Brně. Fakulta informačních technologií Abstract:
[cze][eng]
Tato diplomová práce pojednává o tzv. "dolování dat", tedy získávání takových informací z databází, které nejsou přímo viditelné, ale které lze pomocí speciálních algoritmů z databází získat. Zaměřuje se na klasifikaci dokumentů do tříd v rámci digitální knihovny, vybranou metodou, která je založena na množinách položek tzv. "metoda itemsets". Tato metoda rozšiřuje oblast aplikace Apriori algoritmu určeného původně ke zpracování transakčních databází a generování frekventovaných množin položek. Práce se rovněž zabývá možností modifikace vlastního Apriori algoritmu pro potřeby klasifikace metodou itemsets.
This MSc Thesis handles with so-called data mining. Data mining is about obtaining some data or informations from databases, where these data or informations are not directly visible, but they are accessible by using special algorithms. This MSc Thesis mainly aims documents clasifying by selected method in scope of digital library. The selected method is based on sets of items called "itemsets method". This method extends Apriori algorithm application field originally designed for transaction databases processing and generation of sets of frequented items.
Keywords:
Apriori algorithm; classification; data mining; digital library; frequent Itemsets; itemset; method Itemsets; transaction databases; Apriori algoritmus; digitální knihovna; dolování dat; frekventovaná množina položek; klasifikace; metoda itemsets; množina položek; transakční databáze
Institution: Brno University of Technology
(web)
Document availability information: Fulltext is available in the Brno University of Technology Digital Library. Original record: http://hdl.handle.net/11012/187513