Original title:
Automatická tvorba tezauru z wikipedie
Translated title:
Acquiring Thesauri from Wikipedia
Authors:
Novák, Ján ; Schmidt, Marek (referee) ; Otrusina, Lubomír (advisor) Document type: Master’s theses
Year:
2011
Language:
cze Publisher:
Vysoké učení technické v Brně. Fakulta informačních technologií Abstract:
[cze][eng]
Tato práce se věnuje problematice automatické tvorby tezauru z Wikipedie. Obsahuje popis struktury Wikipedie jako vhodné datové sady pro tvorbu tezauru a popisuje některé metody výpočtu sémantické blízkosti termínů, které budou využity při tvorbě tezauru. Dále obsahuje popis návrhu a implementace systému pro automatickou tvorbu tezauru z Wikipedie. Na závěr je provedeno vyhodnocení výsledků systému.
This thesis deals with automatic acquiring thesauri from Wikipedia. It describes Wikipedia as a suitable data set for thesauri acquiring and also methods for computing semantic similarity of terms are described. The thesis also contains a description of concepts and implementation of the system for automatic thesauri acquiring. Finally, the implemented system is evaluated by the standard metrics, such as precision or recall.
Keywords:
Latent Semantic Analysis; Lexical Substitution; Random Indexing; Semantic Term Relatedness; Semantic Term Similarity; Thesauri; Wikipedia; latentní sémantická analýza; lexikální substituce; Random Indexing; sémantická blízkost termínů; sémantická podobnost termínů; tezaurus; Wikipedie
Institution: Brno University of Technology
(web)
Document availability information: Fulltext is available in the Brno University of Technology Digital Library. Original record: http://hdl.handle.net/11012/54107