Název:
Dolování dat z webu
Překlad názvu:
Webmining
Autoři:
Ljubopytnov, Vladimír ; Húsek, Dušan (oponent) ; Pokorný, Jaroslav (vedoucí práce) Typ dokumentu: Diplomové práce
Rok:
2007
Jazyk:
cze
Abstrakt: [cze][eng] Tato práce se soustředí na zmapování současných poznatků v oblasti dolování dat z webu s důrazem na shlukování dokumentů. Nejpodrobněji je zkoumán algoritmus projektivního shlukování DOC, je uvedena jeho modifikace pro data s váženými dimenzemi. Algoritmus je aplikován při shlukování výsledků webového vyhledávače. Součástí práce je implementace Javovského shlukovacího balíčku s rozhraním pro vyhledávač Google a s nástrojem pro hodnocení kvality frází.This thesis focuses on mapping latest knowledge in the area of web mining with emphasis on document clustering. Most attention is given to the DOC projective clustering algorithm, a modification is presented for data with weighted dimensions. Algorithm is used for web search engine result clustering. Also, a clustering package with Google interface and phrase evaluation tool is implemented.