Original title:
Extrakce informací z Wikipedie
Translated title:
Information Extraction from Wikipedia
Authors:
Jurišica, Rudolf ; Otrusina, Lubomír (referee) ; Smrž, Pavel (advisor) Document type: Bachelor's theses
Year:
2024
Language:
cze Publisher:
Vysoké učení technické v Brně. Fakulta informačních technologií Abstract:
[cze][eng]
Cílem práce je snížit počet neznámých odkazovaných entit ve článcích české Wikipedie. Dosáhnuto toho bylo jednak za využití pomocných, již existujících řešení, tvořených výzkumnou skupinou KNOT na VUT FIT, a dále pak vytvořením sady programů. Tyto programy se automaticky spouští každý měsíc při vydání nové verze Wikipedie. Automaticky doplní znalostní bázi o nová jména, vygeneruje jejich odvozené tvary, a upraví samotné články přímo na Wikipedii.
The goal of this thesis is to reduce the number of unknown referenced entities in Czech Wikipedia articles. This has been achieved by using some existing solutions, created by the KNOT research group at FIT BUT, and then by creating a set of programs. These programs are automatically run every month, when a new version of Wikipedia is released. They will automatically add new names to the knowledge base, generate their derived forms, and edit the articles themselves directly on Wikipedia.
Keywords:
adjectives; analysis; foreign names; information extraction; knowledge base; machine learning; morphology; natural language; Pywikibot; Wikidata; Wikipedia; analýza; cizí jména; extrakce informací; morfologie; Pywikibot; přirozený jazyk; přídavná jména; strojové učení; Wikidata; Wikipedie; znalostní báze
Institution: Brno University of Technology
(web)
Document availability information: Fulltext is available in the Brno University of Technology Digital Library. Original record: https://hdl.handle.net/11012/246574