Název:
Získávání znalostí na webu - shlukování
Překlad názvu:
Web Mining - Clustering
Autoři:
Rychnovský, Martin ; Burget, Radek (oponent) ; Bartík, Vladimír (vedoucí práce) Typ dokumentu: Diplomové práce
Rok:
2008
Jazyk:
cze
Nakladatel: Vysoké učení technické v Brně. Fakulta informačních technologií
Abstrakt: [cze][eng]
Práce se zabývá problematikou získávání znalostí na webu. Cílem bylo prostudovat metody shlukovaní a realizovat shlukování pomocí algoritmu k-means. Potom algoritmus testovat na množině dokumentů a datech získaných z webu a následně vyhodnotit dosažené výsledky této metody. Shlukování bylo implementováno pomocí technologie Java.
This work presents the topic of data mining on the web. It is focused on clustering. The aim of this project was to study the field of clustering and to implement clustering through the k-means algorithm. Then, the algorithm was tested on a dataset of text documents and on data extracted from web. This clustering method was implemented by means of Java technologies.
Klíčová slova:
centrální bod shluku.; dolování dat na webu; k-means; předzpracování; shluková analýza; výpočet vzdálenosti; Získávání znalostí; cluster analysis; cluster center.; compute distance; Data Mining; k-means; preprocessing; web mining
Instituce: Vysoké učení technické v Brně
(web)
Informace o dostupnosti dokumentu:
Plný text je dostupný v Digitální knihovně VUT. Původní záznam: http://hdl.handle.net/11012/53203