Indexování a prohledávání sémanticky anotovaných textů
Indexing and Searching Semantically Annotated Texts
Panov, Sergey ; Dytrych, Jaroslav (referee) ; Smrž, Pavel (advisor) Document type: Bachelor's theses
Vysoké učení technické v Brně. Fakulta informačních technologií
Tato práce řeší problém vyhledávání v sémanticky anotovaných textech. Cílem této práce je navrhnout a implementovat systém schopný vyhledat dokumenty obsahující fragmenty definované uživatelem a obohatit entity či ne-entity o syntaktické a sémantické informace, které nejsou implicitně zmíněné. Práce se zaměřuje na analýzu již existujícího řešení a principu práce nástroje MG4J. Problém je řešen rozšířením funkcionality již existujícího systému a vytvořením nové části, která má za cíl zajistit sbíraní vyhledaných dat. Výsledkem jsou dva programy. Jeden z nich zajišťuje vyhledání v dokumentech uložených na serveru a je serverovou aplikaci. Další je klientskou aplikaci, která sbírá data z více serverů. Výsledky této práce umožňují provádět pokročilé dotazování a získávat informace, které nejsou explicitně zmíněny v textu, o jednotlivých entitách reálného světa.
This thesis solves the problem of search in the semantically enriched texts. The task of this thesis is to propose and implement a system for searching documents which contain fragments defined by user and enrich entities or non-entities by syntactic and semantic information, which is not mentioned implicitly. The thesis focuses on analysis of existing solution and principles of MG4J engine. The problem was resolved by extending already existing system and implementing a new part, which ensure the data collection. As a result two programs were implemented. One of them ensure the retrieval in document collection stored on a server and is a server-side application. The second one is a client-side application which ensures collection of data from the servers. The implemented programs allow to make advanced queries and get information, which is not explicitly mentioned in text, about entities of the real world.
Indexation; MG4J; Querying enriched texts.; Search in annotated texts; Semantic and syntactic annotation; Dotazování nad obohacenými texty.; Indexování; MG4J; Prohledávání anotováných textů; Sémantická a syntaktická anotace
Institution: Brno University of Technology
