Original title:
Shlukování slov podle významu
Translated title:
Word Sense Clustering
Authors:
Bárta, Jakub ; Otrusina, Lubomír (referee) ; Smrž, Pavel (advisor) Document type: Bachelor's theses
Year:
2012
Language:
cze Publisher:
Vysoké učení technické v Brně. Fakulta informačních technologií Abstract:
[cze][eng]
Tato bakalářská práce se zabývá návrhem a implementací modulárního systému pro analýzu textového korpusu a následné vyhledávání sémanticky podobných slov. Systém umožňuje stemming korpusu, uživatel si může zvolit z různých způsobů analýzy korpus (matice spoluvýskytu, LSA).
This bachelor's thesis deals with the design and implementation of a modular system focused on semantic similarity. System is able to stem the corpus and to analyze corpus in different ways - through coocurrence matrix or LSA.
Keywords:
coocurrence matrix}; gensim; LSA; natural language processing; semantic similarity; gensim; LSA; matice spoluvýskytu; přirozené zpracování jazyka; sémantická podobnost
Institution: Brno University of Technology
(web)
Document availability information: Fulltext is available in the Brno University of Technology Digital Library. Original record: http://hdl.handle.net/11012/55338