Original title:
Sémantická analýza webového obsahu
Translated title:
Semantic Analysis of Web Content
Authors:
Hubl, Lukáš ; Rychlý, Marek (referee) ; Burget, Radek (advisor) Document type: Master’s theses
Year:
2020
Language:
cze Publisher:
Vysoké učení technické v Brně. Fakulta informačních technologií Abstract:
[cze][eng]
Tato práce se zabývá problematikou sémantického webu, segmentace webových stránek a technologiemi, které se v těchto oblastech využívají. Dále se zaobírá modifikací jedné z metod pro segmentaci webových stránek, konkrétně metodou využívající DOM stromu, s využitím technologií z oblasti sémantického webu. Tedy navrhuje způsob segmentace webové stránky na základě sémantické analýzy obsahu jednotlivých prvků webové stránky. V rámci této práce byla také vytvořena aplikace, která demonstruje funkcionalitu navržené metody. S aplikací byly následně prováděny experimenty, jejichž zhodnocení je také součástí této práce.
This work deals with the topics of semantic web, web page segmentation and technologies, which are used in this area. It also deals with a modification of one web page segmentation method, specifically DOM-based segmentation, using semantic web technologies. Thus, this work designs the way of web page segmentation based on semantic analysis of individual elements of the web pages content. An application that demonstrates the functionality of the designed segmentation method was also created within this work. With the implemented application, experiments were performed, whose results are also part of this work.
Keywords:
DBpedia; DBpedia-Spotlight; lxml; ontology; Pyspotlight; Python; RDF; RDF/XML; RDFS; Semantic web; Web page segmentation; DBpedia; DBpedia-Spotlight; lxml; ontologie; Pyspotlight; Python; RDF; RDF/XML; RDFS; Segmentace webových stránek; Sémantický web
Institution: Brno University of Technology
(web)
Document availability information: Fulltext is available in the Brno University of Technology Digital Library. Original record: http://hdl.handle.net/11012/192455