Original title:
Získávání znalostí na webu - shlukování
Translated title:
Web Mining - Clustering
Authors:
Rychnovský, Martin ; Burget, Radek (referee) ; Bartík, Vladimír (advisor) Document type: Master’s theses
Year:
2008
Language:
cze Publisher:
Vysoké učení technické v Brně. Fakulta informačních technologií Abstract:
[cze][eng]
Práce se zabývá problematikou získávání znalostí na webu. Cílem bylo prostudovat metody shlukovaní a realizovat shlukování pomocí algoritmu k-means. Potom algoritmus testovat na množině dokumentů a datech získaných z webu a následně vyhodnotit dosažené výsledky této metody. Shlukování bylo implementováno pomocí technologie Java.
This work presents the topic of data mining on the web. It is focused on clustering. The aim of this project was to study the field of clustering and to implement clustering through the k-means algorithm. Then, the algorithm was tested on a dataset of text documents and on data extracted from web. This clustering method was implemented by means of Java technologies.
Keywords:
cluster analysis; cluster center.; compute distance; Data Mining; k-means; preprocessing; web mining; centrální bod shluku.; dolování dat na webu; k-means; předzpracování; shluková analýza; výpočet vzdálenosti; Získávání znalostí
Institution: Brno University of Technology
(web)
Document availability information: Fulltext is available in the Brno University of Technology Digital Library. Original record: http://hdl.handle.net/11012/53203