Original title:
Systém pro rozpoznávání dezinformací v prostředí webu
Translated title:
System for Recognizing Disinformation in Web Environment
Authors:
Večerka, Lukáš ; Žádník, Martin (referee) ; Strnadel, Josef (advisor) Document type: Bachelor's theses
Year:
2024
Language:
cze Publisher:
Vysoké učení technické v Brně. Fakulta informačních technologií Abstract:
[cze][eng]
Tato práce se zabyvá návrhem, realizací a ověřením systému pro automatické rozpoznávání dezinformací v prostředí webu. Představuje problematiku šíření dezinformací v online prostředí a jeho dopad na společnost. Zaměřuje se na trénování několika Českych transformers jazykovych modelů pro rozpoznání dezinformací a dále na automatickou extrakci obsahu článků z českych internetovych novin a jejich analyzu využitím klasifikace textu a zpracování přirozeného jazyka pomocí metod hlubokého učení. Vysledky těchto analyz jsou pak prezentovány na webovém uživatelském rozhraní s cílem poskytnout platformu pro ověření článků, autorů a zdrojů. Rozhraní by mohlo byt použito k anotaci dat experty pro průběžné vylepšování jazykovych modelů.
This work deals with the design, implementation, and verification of a system for automatic recognition of disinformation on the web. It addresses the issue of disinformation spread in the online environment and its impact on society. It focuses on training several Czech transformer language models for disinformation recognition and further automatic extraction of content from Czech online newspapers and their analysis using text classification and natural language processing through deep learning methods. The results of these analyses are then presented in a web user interface with the aim of providing a platform for verifying articles, authors, and sources. The interface could be used for data annotation by experts for continuous improvement of language models.
Keywords:
credibility; data extraction; deep learning; disinformation; fake news; machine learning; natural language processing; NLP; text classification; transformers architecture; Web; web scraping; architektura transformers; dezinformace; důvěryhodnost; extrakce dat; fake news; hluboké učení; klasifikace textu; NLP; strojové učení; web; zpracování přirozeného jazyka
Institution: Brno University of Technology
(web)
Document availability information: Fulltext is available in the Brno University of Technology Digital Library. Original record: https://hdl.handle.net/11012/247827