Název:
Komponent pro sémantické obohacení
Překlad názvu:
Semantic Enrichment Component
Autoři:
Doležal, Jan ;
Otrusina, Lubomír (oponent) ;
Dytrych, Jaroslav (vedoucí práce)
Typ dokumentu: Diplomové práce
Rok:
2018
Jazyk:
cze
Nakladatel: Vysoké učení technické v Brně. Fakulta informačních technologií
Abstrakt: [cze] [eng]
Tato diplomová práce se zabývá komponentou pro sémantické obohacení textu (SEC), která ve vstupním textovém dokumentu nebo vertikálním textu vyhledá entity (např. osoby nebo místa) a informace o nich vrátí na výstup. Cíle této komponenty jsou vytvoření jednotného rozhraní pro nástroje rozpoznávající entity v textu, umožnění paralelního zpracování dokumentů, úspora operační paměti při využívání znalostní báze a zrychlení přístupu k jejímu obsahu. K tomu byl specifikován výstup pro nástroje rozpoznávající entity v textu, implementován nástroj pro uložení předzpracované znalostní báze do sdílené paměti a při tvorbě komponenty bylo využito schéma klient-server.
This master's thesis describes Semantic Enrichment Component (SEC), that searches entities (e.g., persons or places) in the input text document and returns information about them. The goals of this component are to create a single interface for named entity recognition tools, to enable parallel document processing, to save memory while using the knowledge base, and to speed up access to its content. To achieve these goals, the output of the named entity recognition tools in the text was specified, the tool for storing the preprocessed knowledge base into the shared memory was implemented, and the client-server scheme was used to create the component.
Klíčová slova:
4A ;
4A anotační server ;
4A systém ;
alternativní entity ;
anotace ;
anotace textu ;
Decipher ;
démon pro znalostní bázi ;
FIGA ;
KB ;
KNOT ;
NER ;
paralelizace ;
paralelní zpracování ;
porovnávání rozpoznávacích nástrojů NER ;
porovnávání znalostních bází ;
porozumění textu ;
rozpoznání jmených entit ;
sdílená znalostní báze ;
sdílení prostředků ;
sdílení zdrojů ;
SEC ;
SharedKB ;
SXML ;
sémantické obohacení textu ;
vertikál ;
vertikální text ;
vyhledávání entit v KB ;
význam textu ;
znalostní báze ;
zpracování textu ;
4A ;
4A annotation server ;
4A system ;
alternative entities ;
annotation ;
annotation of text ;
comparison of knowledge bases ;
comparison of NER tools ;
deamon for knowledge base ;
Decipher ;
FIGA ;
KB ;
KNOT ;
knowledge base ;
named entity recognition ;
NER ;
parallel processing ;
parallelization ;
processing of the text ;
resource sharing ;
searching of entities in KB ;
SEC ;
semantic enrichment of text ;
shared knowledge base ;
SharedKB ;
sharing of the resources ;
SXML ;
the meaning of the text ;
understanding to the text ;
vertical ;
vertical text
Instituce: Vysoké učení technické v Brně
(
web )
Informace o dostupnosti dokumentu:
Plný text je dostupný v Digitální knihovně VUT.
Původní záznam: http://hdl.handle.net/11012/84974
Trvalý odkaz NUŠL: http://www.nusl.cz/ntk/nusl-385991
Záznam je zařazen do těchto sbírek: Školství > Veřejné vysoké školy > Vysoké učení technické v Brně Vysokoškolské kvalifikační práce > Diplomové práce