|
Systém pro aktualizaci anotací v korpusech
Vrša, Štěpán ; Smrž, Pavel (oponent) ; Dytrych, Jaroslav (vedoucí práce)
Cílem této práce je vytvoření systému, který umožní uživatelsky přívětivým způsobem zobrazit a aktualizovat anotace velkých korpusových dat ve formátu MG4J. Tato práce analyzuje stávající řešení správy korpusových dat a anotací a stručně popisuje netriviální nástroje SEC a MG4J, které jsou využity v řešení. Celý systém je založen na distribuci dat a serverové komunikaci. Stěžejním prvkem systému je aktualizace anotací v MG4J a následná aktualizace indexů MG4J. Systém je schopný provést výše zmíněné operace s přijatelnou dobou odezvy. Tato práce se také zabývá aktualizací entit ve znalostní databázi.
|
|
Komponent pro sémantické obohacení
Doležal, Jan ; Otrusina, Lubomír (oponent) ; Dytrych, Jaroslav (vedoucí práce)
Tato diplomová práce se zabývá komponentou pro sémantické obohacení textu (SEC), která ve vstupním textovém dokumentu nebo vertikálním textu vyhledá entity (např. osoby nebo místa) a informace o nich vrátí na výstup. Cíle této komponenty jsou vytvoření jednotného rozhraní pro nástroje rozpoznávající entity v textu, umožnění paralelního zpracování dokumentů, úspora operační paměti při využívání znalostní báze a zrychlení přístupu k jejímu obsahu. K tomu byl specifikován výstup pro nástroje rozpoznávající entity v textu, implementován nástroj pro uložení předzpracované znalostní báze do sdílené paměti a při tvorbě komponenty bylo využito schéma klient-server.
|
|
Transformace ontologií
Kopecký, Marek ; Škoda, Petr (oponent) ; Dytrych, Jaroslav (vedoucí práce)
Tato diplomová práce je zaměřena na import ontologie v jazyku OWL 2 do vnitřních struktur anotačního 4A serveru. Zabývá se především způsobem zpracování anonymních uzlů, jako například anonymních tříd nebo vlastností. V řešení bylo použito knihovny The OWL API pro import ontologií. Navržené řešení mimo jiné umožňuje automatické generování názvů k anonymním třídám a vlastnostem.
|
|
Moduly anotačního serveru
Strecha, Juraj ; Kouřil, Jan (oponent) ; Dytrych, Jaroslav (vedoucí práce)
Tato práce se zabývá návrhem a implementací jednoho z modulů anotačního serveru v rámci projektu Decipher. Modul má na starosti nabízení anotací k dokumentům, se kterými uživatel systému pracuje. Součástí práce je i analýza anotačního a SEC Store API serveru. Podstatná část je věnována návrhu a implementaci řešení. Samostatnou část tvoří popis testování funkčnosti modulu v systému jako celku. Práce obsahuje také návrh komunikačního protokolu mezi dvěma servery, jehož popis je uveden v dokumentu v příloze.
|
|
Vyhledávání a aktualizace fragmentů anotací
Kubík, Lukáš ; Škoda, Petr (oponent) ; Dytrych, Jaroslav (vedoucí práce)
Tato diplomová práce analyzuje algoritmy anotačního serveru projektu Decipher pro hledání a aktualizaci fragmentů anotací. Analyzované algoritmy vylepšuje a nahrazuje nově navrženými algoritmy. Součástí projektu je také návrh nového algoritmu pro detekci míry ovlivnění anotací po aktualizaci dokumentu.
|
|
Komponent pro sémantické obohacení
Doležal, Jan ; Otrusina, Lubomír (oponent) ; Dytrych, Jaroslav (vedoucí práce)
Tato diplomová práce se zabývá komponentou pro sémantické obohacení textu (SEC), která ve vstupním textovém dokumentu nebo vertikálním textu vyhledá entity (např. osoby nebo místa) a informace o nich vrátí na výstup. Cíle této komponenty jsou vytvoření jednotného rozhraní pro nástroje rozpoznávající entity v textu, umožnění paralelního zpracování dokumentů, úspora operační paměti při využívání znalostní báze a zrychlení přístupu k jejímu obsahu. K tomu byl specifikován výstup pro nástroje rozpoznávající entity v textu, implementován nástroj pro uložení předzpracované znalostní báze do sdílené paměti a při tvorbě komponenty bylo využito schéma klient-server.
|
|
Systém pro aktualizaci anotací v korpusech
Vrša, Štěpán ; Smrž, Pavel (oponent) ; Dytrych, Jaroslav (vedoucí práce)
Cílem této práce je vytvoření systému, který umožní uživatelsky přívětivým způsobem zobrazit a aktualizovat anotace velkých korpusových dat ve formátu MG4J. Tato práce analyzuje stávající řešení správy korpusových dat a anotací a stručně popisuje netriviální nástroje SEC a MG4J, které jsou využity v řešení. Celý systém je založen na distribuci dat a serverové komunikaci. Stěžejním prvkem systému je aktualizace anotací v MG4J a následná aktualizace indexů MG4J. Systém je schopný provést výše zmíněné operace s přijatelnou dobou odezvy. Tato práce se také zabývá aktualizací entit ve znalostní databázi.
|
|
Moduly anotačního serveru
Strecha, Juraj ; Kouřil, Jan (oponent) ; Dytrych, Jaroslav (vedoucí práce)
Tato práce se zabývá návrhem a implementací jednoho z modulů anotačního serveru v rámci projektu Decipher. Modul má na starosti nabízení anotací k dokumentům, se kterými uživatel systému pracuje. Součástí práce je i analýza anotačního a SEC Store API serveru. Podstatná část je věnována návrhu a implementaci řešení. Samostatnou část tvoří popis testování funkčnosti modulu v systému jako celku. Práce obsahuje také návrh komunikačního protokolu mezi dvěma servery, jehož popis je uveden v dokumentu v příloze.
|
|
Transformace ontologií
Kopecký, Marek ; Škoda, Petr (oponent) ; Dytrych, Jaroslav (vedoucí práce)
Tato diplomová práce je zaměřena na import ontologie v jazyku OWL 2 do vnitřních struktur anotačního 4A serveru. Zabývá se především způsobem zpracování anonymních uzlů, jako například anonymních tříd nebo vlastností. V řešení bylo použito knihovny The OWL API pro import ontologií. Navržené řešení mimo jiné umožňuje automatické generování názvů k anonymním třídám a vlastnostem.
|
|
Vyhledávání a aktualizace fragmentů anotací
Kubík, Lukáš ; Škoda, Petr (oponent) ; Dytrych, Jaroslav (vedoucí práce)
Tato diplomová práce analyzuje algoritmy anotačního serveru projektu Decipher pro hledání a aktualizaci fragmentů anotací. Analyzované algoritmy vylepšuje a nahrazuje nově navrženými algoritmy. Součástí projektu je také návrh nového algoritmu pro detekci míry ovlivnění anotací po aktualizaci dokumentu.
|