Název:
Extrakce informací z Wikipedie
Překlad názvu:
Information Extraction from Wikipedia
Autoři:
Jurišica, Rudolf ; Otrusina, Lubomír (oponent) ; Smrž, Pavel (vedoucí práce) Typ dokumentu: Bakalářské práce
Rok:
2024
Jazyk:
cze
Nakladatel: Vysoké učení technické v Brně. Fakulta informačních technologií
Abstrakt: [cze][eng]
Cílem práce je snížit počet neznámých odkazovaných entit ve článcích české Wikipedie. Dosáhnuto toho bylo jednak za využití pomocných, již existujících řešení, tvořených výzkumnou skupinou KNOT na VUT FIT, a dále pak vytvořením sady programů. Tyto programy se automaticky spouští každý měsíc při vydání nové verze Wikipedie. Automaticky doplní znalostní bázi o nová jména, vygeneruje jejich odvozené tvary, a upraví samotné články přímo na Wikipedii.
The goal of this thesis is to reduce the number of unknown referenced entities in Czech Wikipedia articles. This has been achieved by using some existing solutions, created by the KNOT research group at FIT BUT, and then by creating a set of programs. These programs are automatically run every month, when a new version of Wikipedia is released. They will automatically add new names to the knowledge base, generate their derived forms, and edit the articles themselves directly on Wikipedia.
Klíčová slova:
analýza; cizí jména; extrakce informací; morfologie; Pywikibot; přirozený jazyk; přídavná jména; strojové učení; Wikidata; Wikipedie; znalostní báze; adjectives; analysis; foreign names; information extraction; knowledge base; machine learning; morphology; natural language; Pywikibot; Wikidata; Wikipedia
Instituce: Vysoké učení technické v Brně
(web)
Informace o dostupnosti dokumentu:
Plný text je dostupný v Digitální knihovně VUT. Původní záznam: https://hdl.handle.net/11012/246574