Original title:
Struktury trie pro zpracování rozsáhlých textových dat
Translated title:
Trie Structures for Large Text Data Processing
Authors:
Rajčok, Andrej ; Otrusina, Lubomír (referee) ; Smrž, Pavel (advisor) Document type: Master’s theses
Year:
2016
Language:
cze Publisher:
Vysoké učení technické v Brně. Fakulta informačních technologií Abstract:
[cze][eng]
Táto práca rozoberá spracovanie prirodzeného jazyka so zameraním sa na morfologickú analýzu a spoznávanie pomenovaných entít. Rozoberá efektívne vyhľadávanie v slovníkoch a v ňom používaných špecializovaných stručných štruktúr a ich praktické implementácie. Popisuje návrh a implementáciu systému pre spoznávanie pomenovaných entít a morfologického analyzátora za využitia stručných štruktúr a nakoniec porovnáva a testuje ich efektivitu a rýchlosť.
This study analyzes natural language processing with emphasis on morphological analysis of inflective languages and systems for named entity recognition. It analyzes effective pattern matching in dictionary by using succint structures and then analyzes practical implementation of succint structures. It describes design and implementation of named entity recognition system and morphological analyzer and compares and test their speed and effectiveness.
Keywords:
cedar; darts-clone; DAWG; morphological analyzer; named entity recognition; natural language processing; succint structures; cedar; darts-clone; DAWG; morfologický analyzátor; spoznávanie pomenovaných entít; spracovanie prirodzeného jazyka; stručné štruktúry
Institution: Brno University of Technology
(web)
Document availability information: Fulltext is available in the Brno University of Technology Digital Library. Original record: http://hdl.handle.net/11012/61833