|
Rychlá adaptace počítačové podpory hry Krycí jména pro nové jazyky
Jareš, Petr ; Otrusina, Lubomír (oponent) ; Smrž, Pavel (vedoucí práce)
Tato diplomová práce rozšiřuje herní systém umělého hráče slovně-asociační hry Krycí jména o snadné přídání podpory pro nové jazyky. Systém je schopný hrát Krycí jména v rolích hádajícího hráče, zadavatele nápověd a jejich kombinací hráče verze Duet. K analýze různých jazyků byl použit neurální nástroj Stanza, který je jazykově nezávislý a umožňujě automatizované zpracování celé řady jazyků. Jednalo se především o lemmatizaci slov a určování slovních druhů pro výběr kandidátních nápověd ve hře. Pro vyhodnocení slovních asociací byla testována řada modelů, kde nejlepších výsledků dosahovala metoda Pointwise Mutual Information a prediktivní model fastText. Systém podporuje hraní Krycích jmen v 36 jazycích tvořených 8 různými abecedami.
|
|
Rozpoznání pojmenovaných entit v textu
Süss, Martin
Tato práce se zabývá rozpoznáváním pojmenovaných entit v textu, které je realizované technikami strojového učení. V nedávné době byly představeny techniky vytváření modelů vektorových reprezentací slov, které dokáží do vektorů zakódovat mnoho užitečných vztahů mezi slovy v textových datech, jako např. jejich syntaktickou či sémantickou podobnost. Moderní systémy pro rozpoznávání pojmenovaných entit tyto vlastnosti vektorů využívají, čímž výrazněji zlepšují svoji kvalitu. Málo z nich však detailněji zkoumá, jak velký vliv tyto vektory na rozpoznávání mají a jestli je lze optimalizovat pro ještě větší nárůst kvality rozpoznávání. Tato práce zkoumá různé faktory, které mohou ovlivnit kvalitu modelů vektorových reprezentací slov, a tím i výslednou kvalitu rozpoznávání pojmenovaných entit. V práci je vykonána série experimentů, které tyto faktory, jako je kvalita a velikost korpusu, počet dimenzí vektorů, techniky předzpracování textu či různé algoritmy (Word2Vec, GloVe a FastText) a specifické nastavení jejich parametrů, zkoumají. Jejich výsledky přinášejí řadu poznatků, které lze využít při vytváření vektorových reprezentací slov, a tím i nepřímo navýšit výslednou kvalitu rozpoznávání pojmenovaných entit.
|
|
Získavanie a analýza dát pre oblasť crowdfundingu
Koštial, Martin
Práce se zabývá získáváním dat z oblasti crowdfunding a jejich analýzou. Teoretická část je zaměřena na popis dostupných technologií a algoritmů pro analýzu dat. V praktické části je realizován sběr dat. Následně jsou v této části pro data aplikované algoritmy z oblasti data miningu a text miningu.
|
|
Počítač jako inteligentní spoluhráč ve slovně-asociační hře Krycí jména
Jareš, Petr ; Fajčík, Martin (oponent) ; Smrž, Pavel (vedoucí práce)
Tato práce řeší určování sémantické podobnosti slov. K tomu je využita kombinace prediktivního modelu fastText a metody založené na počtu Pointwise Mutual Information. Je zde popsán systém, který s využitím sémantických modelů je schopen zastoupit hráče ve slovně-asociační hře Krycí jména. Systém má implementovanou herní strategii využívající informace z průběhu hry k prospěchu týmu, za který hraje. Systém je schopen plnit funkci hráče hádajícího asociovaná slova k nápovědě, tak i hráče vytvářejícího vlastní nápovědy.
|
| |
|
Shlukování slov podle významu
Hošták, Viliam Samuel ; Otrusina, Lubomír (oponent) ; Smrž, Pavel (vedoucí práce)
Táto práca sa zaoberá sémantickou podobnosťou slov. Popisuje a porovnáva existujúce modely, ktoré sa aktuálne pre tento účel používajú. Rozoberá návrh a implementáciu vytvoreného systému na predspracovanie textového korpusu, vytváranie sémantických modelov a vyhľadávanie sémanticky príbuzných slov. Vytvorený systém umožňuje prácu s distribučnými sémantickými modelmi Word2vec, FastText a GloVe.
|