Original title:
Navrhování klíčových slov v Centrálním portálu knihoven
Translated title:
Keyword Suggestion in the Central Portal of Czech Libraries
Authors:
Balaga, Róbert ; Otrusina, Lubomír (referee) ; Smrž, Pavel (advisor) Document type: Bachelor's theses
Year:
2018
Language:
cze Publisher:
Vysoké učení technické v Brně. Fakulta informačních technologií Abstract:
[cze][eng]
Táto práca sa zaoberá rôznymi metódami extrakcie kľúčových výrazov z dokumentov, zo zameraním na diela z Centrálneho portálu knižníc. Boli implementované rôzne metódy z kategórie štatistických, lingvistických metód a metód založených na grafoch. Tiež bola navrhnutá vlastná metóda, ktorá kombinuje prístup štatistických a lingvistických metód. Jednotlivé metódy boli testované a analyzované pomocou štandardných metrík, pričom navrhnutá metóda dosiahla úspešnosť 30 percent.
This thesis deals with various methods of keyphrase extraction from documents, specifically focused on documents from the Central Portal of Czech Libraries. Various methods from statistical, linguistic and graph-based methods have been implemented. Also a new method was suggested, that combines the statistical and linguistic approach. Individual methods have been tested and analyzed according to the standard evaluation metrics, with the suggested method achieving recall of 30 percent.
Keywords:
hybrid methods; keyword extraction; keywords; natural language processing; statistical methods; extrakcia kľúčových slov; hybridné metódy; kľúčové slová; spracovanie prirodzeného jazyka; štatistické metódy
Institution: Brno University of Technology
(web)
Document availability information: Fulltext is available in the Brno University of Technology Digital Library. Original record: http://hdl.handle.net/11012/85249