Original title:
Metavyhledávání recenzí na českém webu
Translated title:
Metasearch for Reviews on the Czech Web
Authors:
Šmahel, Michal ; Doležal, Jan (referee) ; Smrž, Pavel (advisor) Document type: Bachelor's theses
Year:
2023
Language:
cze Publisher:
Vysoké učení technické v Brně. Fakulta informačních technologií Abstract:
[cze][eng]
Hlavním cílem této práce je vytvořit metavyhledávač pro recenzní články s vestavěnou analýzou polarity názorů. Kromě toho byl pro dosažení nejlepších možných výsledků proveden komplexní průzkum nástrojů pro extrakci hlavního textu a nástrojů pro automatické ovládání webového prohlížeče za účelem získávání dat z webových stránek. Výsledný metavyhledávač poskytuje webové rozhraní pro vyhledávání relevantních recenzních článků, čímž šetří čas strávený ručním vyhledáváním. Díky víceúrovňovému filtrování založenému na transformerech dokáže asi za 4 minuty vrátit 10—15 relevantních recenzních článků na často recenzovaná témata bez námahy prostřednictvím pouhého stisknutí tlačítka.
The main purpose of this work is to create a metasearch engine for review articles with built-in sentiment analysis. In addition, a complex survey of main text extraction tools and web browser automation tools for web crawling has been carried out to achieve of the best possible results. The resulting metasearch engine provides a web interface for searching relevant review articles, thus saving time spent on manual searching. Thanks to multi-level transformer-based filtering, it can return 10—15 relevant review articles on frequently reviewed topics in about 4 minutes with no effort, just by clicking on a button.
Keywords:
clasiffication; Metasearch; review; review article; search; sentiment analysis; web; analýza postojů; klasifikace; Metavyhledávání; recenze; recenzní článek; vyhledávání; web
Institution: Brno University of Technology
(web)
Document availability information: Fulltext is available in the Brno University of Technology Digital Library. Original record: http://hdl.handle.net/11012/213757