Název:
Word2vec modely s přidanou kontextovou informací
Překlad názvu:
Word2vec Models with Added Context Information
Autoři:
Šůstek, Martin ; Rozman, Jaroslav (oponent) ; Zbořil, František (vedoucí práce) Typ dokumentu: Diplomové práce
Rok:
2017
Jazyk:
cze
Nakladatel: Vysoké učení technické v Brně. Fakulta informačních technologií
Abstrakt: [cze][eng]
Tato práce se zabývá porozuměním word2vec modelů. Přestože tyto modely vznikly nedávno (2013), staly se velmi populárními. Učením těchto modelů lze obdržet vektorovou reprezentaci slov v~N-dimenzionálním prostoru reálných čísel. Pomocí operací nad těmito vektory je možné určit sémantické vazby mezi slovy. Dále se práce snaží o rozšíření představených modelů za účelem jiné reprezentace slov. K tomuto účelu je navrženo využití obrazové informace. Taktéž je diskutována možnost použití konvolučních neuronových sítí ve spojitosti s poskytnutím odlišné kontextové informace.
This thesis is concerned with the explanation of the word2vec models. Even though word2vec was introduced recently (2013), many researchers have already tried to extend, understand or at least use the model because it provides surprisingly rich semantic information. This information is encoded in N-dim vector representation and can be recall by performing some operations over the algebra. As an addition, I suggest a model modifications in order to obtain different word representation. To achieve that, I use public picture datasets. This thesis also includes parts dedicated to word2vec extension based on convolution neural network.
Klíčová slova:
AI; CNN; Konvoluční neuronové sítě; LM; Neuronové sítě; NLP; Softmax; Sémantická podobnost; Umělá inteligence; Vnořování slov; Word2vec; Zpracování přirozeného jazyka; AI; Artificial Inteligence; Artificial Neural Networks; CNN; Convolution Neural Network; Language Modelling; LM; Natural Language Processing; NLP; Semantic Similarity; Softmax; Word Embeddings; Word2vec
Instituce: Vysoké učení technické v Brně
(web)
Informace o dostupnosti dokumentu:
Plný text je dostupný v Digitální knihovně VUT. Původní záznam: http://hdl.handle.net/11012/69531