Název:
Konfigurovatelné vyhledávání entit
Překlad názvu:
Configurable Entity Extraction
Autoři:
Koval, Petr ; Hric, Jan (vedoucí práce) ; Kopecký, Michal (oponent) Typ dokumentu: Bakalářské práce
Rok:
2008
Jazyk:
cze
Abstrakt: [cze][eng] Predložená bakalárská práce se zabývá úlohou extrakce informací. Predmetem práce je implementace systému pro extrakci informací, který bude zameren na ceské texty. Vytvorený systém nejprve na základe tréninkových príkladu automaticky zkonstruuje množinu extrakcních vzoru. Následne je systém schopen s využitím získaných extrakcních vzoru nalézt relevantní entity v predložených kolekcích textu. Návrh systému umožnuje využít vytvorenou množinu extrakcních vzoru jak pri doménovém vyhledávání, tak i pri vyhledávání bez doménového rozlišení. Práce rovnež obsahuje popis obdobných systému pracujících s anglickými texty.In the present work we deal with the task of the Information Extraction. The task of this work is to implement a system for Information Extraction working with Czech texts. At first, created system constructs automatically a set of extraction patterns. The construction of this set is based on training examples. Then the system is able to find relevant entities in the present collections of texts. Design of our system enables to use the created set of extraction patterns both for domain searching and for searching without domain specification. This work contains description of similar systems working with English texts.