Název:
Indexace rozsáhlých textových dat a vyhledávání v zaindexovaných datech
Překlad názvu:
Indexing of Big Text Data and Searching in the Indexed Data
Autoři:
Kozák, David ; Smrž, Pavel (oponent) ; Dytrych, Jaroslav (vedoucí práce) Typ dokumentu: Diplomové práce
Rok:
2020
Jazyk:
eng
Nakladatel: Vysoké učení technické v Brně. Fakulta informačních technologií
Abstrakt: [eng][cze]
Tématem této práce je sémantické vyhledávání ve velkých textových datech. Cílem je navrhnout a implementovat vyhledávač, který se bude efektivně dotazovat nad sémanticky obohacenými dokumenty a prezentovat výsledky uživatelsky přívětivým způsobem. V práci jsou nejdříve analyzovány současné sémantické vyhledávače, spolu s jejich silnými a slabými stránkami. Poté je přednesen návrh nového vyhledávače s vlastním dotazovacím jazykem. Tento systém se skládá z komponent pro indexaci a dotazování se nad dokumenty, management serveru, překladače pro dotazovací jazyk a dvou klientských aplikací, webové a konzolové. Vyhledávač byl úspěšně navržen, implementován i nasazen a je veřejně dostupný na Internetu. Výsledky práce umožňují široké veřejnosti využívat sémantického vyhledávání.
The topic of this thesis is semantic searching over big textual data. The goal is to design and implement a search engine that queries the semantically enhanced documents efficiently and has a user friendly interface for working with the results. Firstly, state of the art solutions along with their strengths and shortcomings are analyzed. Then a design for new search engine is presented along with a specialized query language. The system consists of components for indexing and searching the documents, management server, compiler for the query language and two clients, web based and command line. The engine has been successfully designed, developed and deployed and is available via the Internet. As a result of that, the possibility of using of the semantic searching is available to a wide audience.
Klíčová slova:
annotation; big data; compiler; indexation; MG4J; search engine; searching; semantic enhancement; anotace; big data; indexace; MG4J; překladač; sémanticky obohacené texty; vyhledávač; vyhledávání
Instituce: Vysoké učení technické v Brně
(web)
Informace o dostupnosti dokumentu:
Plný text je dostupný v Digitální knihovně VUT. Původní záznam: http://hdl.handle.net/11012/192492