Název:
Segmentace webových stránek s využitím shlukování
Překlad názvu:
Web Page Segmentation Algorithms Based on Clustering
Autoři:
Lengál, Tomáš ; Bartík, Vladimír (oponent) ; Burget, Radek (vedoucí práce) Typ dokumentu: Diplomové práce
Rok:
2017
Jazyk:
cze
Nakladatel: Vysoké učení technické v Brně. Fakulta informačních technologií
Abstrakt: [cze][eng]
Tato zpráva se zabývá segmentací webových stránek, jež je důležitou součástí oboru extrakce informací. V první části popisujeme několik obecných způsobů jak se dá implementovat. Následně je pak představena metoda Box Clustering Segmentation, ktrerá přichází s mírně odlišným přístupem k segmentaci. V druhé polovině práce je pak popsána implementace této metody v rámci nástroje FITLayout a závěrečné testování.
This report deals with segmentation of web pages, which is important discipline of information extraction. In the first part, we describe several general ways to implement it. After that we introduce method Box Clustering Segmentation, which comes with a slightly different approach towards segmentation. In the second half, we describe implementation of this method as a part of framework FITLayout and final testing.
Klíčová slova:
algoritmus Box Clustering Segmentation; extrakce informací; framework FITLayout; Segmentace webových stránek; Box Clustering Segmentation algorithm; FITLayout framework; information extraction; Web page segmemntation
Instituce: Vysoké učení technické v Brně
(web)
Informace o dostupnosti dokumentu:
Plný text je dostupný v Digitální knihovně VUT. Původní záznam: http://hdl.handle.net/11012/69561