Název:
Automatická tvorba tezauru z wikipedie
Překlad názvu:
Acquiring Thesauri from Wikipedia
Autoři:
Novák, Ján ; Schmidt, Marek (oponent) ; Otrusina, Lubomír (vedoucí práce) Typ dokumentu: Diplomové práce
Rok:
2011
Jazyk:
cze
Nakladatel: Vysoké učení technické v Brně. Fakulta informačních technologií
Abstrakt: [cze][eng]
Tato práce se věnuje problematice automatické tvorby tezauru z Wikipedie. Obsahuje popis struktury Wikipedie jako vhodné datové sady pro tvorbu tezauru a popisuje některé metody výpočtu sémantické blízkosti termínů, které budou využity při tvorbě tezauru. Dále obsahuje popis návrhu a implementace systému pro automatickou tvorbu tezauru z Wikipedie. Na závěr je provedeno vyhodnocení výsledků systému.
This thesis deals with automatic acquiring thesauri from Wikipedia. It describes Wikipedia as a suitable data set for thesauri acquiring and also methods for computing semantic similarity of terms are described. The thesis also contains a description of concepts and implementation of the system for automatic thesauri acquiring. Finally, the implemented system is evaluated by the standard metrics, such as precision or recall.
Klíčová slova:
latentní sémantická analýza; lexikální substituce; Random Indexing; sémantická blízkost termínů; sémantická podobnost termínů; tezaurus; Wikipedie; Latent Semantic Analysis; Lexical Substitution; Random Indexing; Semantic Term Relatedness; Semantic Term Similarity; Thesauri; Wikipedia
Instituce: Vysoké učení technické v Brně
(web)
Informace o dostupnosti dokumentu:
Plný text je dostupný v Digitální knihovně VUT. Původní záznam: http://hdl.handle.net/11012/54107