Název:
Získávání znalostí z textových dat
Překlad názvu:
Knowledge Discovery in Text
Autoři:
Smékal, Luděk ; Burget, Radek (oponent) ; Bartík, Vladimír (vedoucí práce) Typ dokumentu: Diplomové práce
Rok:
2007
Jazyk:
cze
Nakladatel: Vysoké učení technické v Brně. Fakulta informačních technologií
Abstrakt: [cze][eng]
Tato diplomová práce pojednává o tzv. "dolování dat", tedy získávání takových informací z databází, které nejsou přímo viditelné, ale které lze pomocí speciálních algoritmů z databází získat. Zaměřuje se na klasifikaci dokumentů do tříd v rámci digitální knihovny, vybranou metodou, která je založena na množinách položek tzv. "metoda itemsets". Tato metoda rozšiřuje oblast aplikace Apriori algoritmu určeného původně ke zpracování transakčních databází a generování frekventovaných množin položek. Práce se rovněž zabývá možností modifikace vlastního Apriori algoritmu pro potřeby klasifikace metodou itemsets.
This MSc Thesis handles with so-called data mining. Data mining is about obtaining some data or informations from databases, where these data or informations are not directly visible, but they are accessible by using special algorithms. This MSc Thesis mainly aims documents clasifying by selected method in scope of digital library. The selected method is based on sets of items called "itemsets method". This method extends Apriori algorithm application field originally designed for transaction databases processing and generation of sets of frequented items.
Klíčová slova:
Apriori algoritmus; digitální knihovna; dolování dat; frekventovaná množina položek; klasifikace; metoda itemsets; množina položek; transakční databáze; Apriori algorithm; classification; data mining; digital library; frequent Itemsets; itemset; method Itemsets; transaction databases
Instituce: Vysoké učení technické v Brně
(web)
Informace o dostupnosti dokumentu:
Plný text je dostupný v Digitální knihovně VUT. Původní záznam: http://hdl.handle.net/11012/187513