Original title:
Systém pro aktualizaci anotací v korpusech
Translated title:
System for Update of Annotations in Corpora
Authors:
Vrša, Štěpán ; Smrž, Pavel (referee) ; Dytrych, Jaroslav (advisor) Document type: Bachelor's theses
Year:
2017
Language:
cze Publisher:
Vysoké učení technické v Brně. Fakulta informačních technologií Abstract:
[cze][eng]
Cílem této práce je vytvoření systému, který umožní uživatelsky přívětivým způsobem zobrazit a aktualizovat anotace velkých korpusových dat ve formátu MG4J. Tato práce analyzuje stávající řešení správy korpusových dat a anotací a stručně popisuje netriviální nástroje SEC a MG4J, které jsou využity v řešení. Celý systém je založen na distribuci dat a serverové komunikaci. Stěžejním prvkem systému je aktualizace anotací v MG4J a následná aktualizace indexů MG4J. Systém je schopný provést výše zmíněné operace s přijatelnou dobou odezvy. Tato práce se také zabývá aktualizací entit ve znalostní databázi.
The goal of this thesis is the creation of a system that allows users to display and update the large corpus data annotations in the MG4J format. This thesis analyzes the current corpus data and annotation management solution and briefly describes the non-trivial SEC and MG4J tools used in the solution. The main element of the system is updating annotations in MG4J and subsequently updating the MG4J indexes. The system is capable of performing the above mentioned operations with an acceptable response time. This thesis also deals with updating entities in a knowledge base.
Keywords:
4A; annotation update.; corpus; indexing; knowledge base; MG4J; MG4J_API; SEC; vertical text; 4A; aktualizace anotací.; indexace; korpus; MG4J; MG4J_API; SEC; vertikální text; znalostní databáze
Institution: Brno University of Technology
(web)
Document availability information: Fulltext is available in the Brno University of Technology Digital Library. Original record: http://hdl.handle.net/11012/69719