Název:
Shlukování slov podle významu
Překlad názvu:
Word Sense Clustering
Autoři:
Bárta, Jakub ; Otrusina, Lubomír (oponent) ; Smrž, Pavel (vedoucí práce) Typ dokumentu: Bakalářské práce
Rok:
2012
Jazyk:
cze
Nakladatel: Vysoké učení technické v Brně. Fakulta informačních technologií
Abstrakt: [cze][eng]
Tato bakalářská práce se zabývá návrhem a implementací modulárního systému pro analýzu textového korpusu a následné vyhledávání sémanticky podobných slov. Systém umožňuje stemming korpusu, uživatel si může zvolit z různých způsobů analýzy korpus (matice spoluvýskytu, LSA).
This bachelor's thesis deals with the design and implementation of a modular system focused on semantic similarity. System is able to stem the corpus and to analyze corpus in different ways - through coocurrence matrix or LSA.
Klíčová slova:
gensim; LSA; matice spoluvýskytu; přirozené zpracování jazyka; sémantická podobnost; coocurrence matrix}; gensim; LSA; natural language processing; semantic similarity
Instituce: Vysoké učení technické v Brně
(web)
Informace o dostupnosti dokumentu:
Plný text je dostupný v Digitální knihovně VUT. Původní záznam: http://hdl.handle.net/11012/55338