keywords:"Word2vec" - Výsledky hledání - Digitální repozitář

host :: přihlásit Digitální repozitář
		Hledej		Nový záznam		Nápověda		O repozitáři

Hlavní stránka > Výsledky hledání: keywords:"Word2vec"

Hledej:

Tipy pro vyhledávaní :: Rozšířené hledání

Hledej ve sbírkách:

Seřadit podle:	Zobrazit výsledky:	Výstupní formát:

	Biblické parafrázování Michálek, Ondřej ; Rosa, Rudolf (vedoucí práce) ; Barančíková, Petra (oponent) V této bakalářské práci se zabývám parafrázováním textu na úrovni slov, konkrétně parafrázováním biblických textů v češtině. Součástí parafráze by měla být i modernizace textu, aby se stal srozumitelnějším pro běžného čtenáře. Pro tyto účely jsem vyvinul desktopovou uživatelskou aplikaci, ve které využívám nástroje pro analýzu a generování jazyka: Word2vec a MorphoDiTu. Ve své práci porovnávám výsledky jednotlivých přístupů v parafrázování. Vyhodnocení výsledků sleduje několik kritérií a porovnávám účinnost použitých metod na verších z Bible kralické a Českého ekumenického překladu. Úplný záznam
	Dolování znalostí z textových dat související s migrační krizí Koukal, Filip Tato bakalářská práce se zabývá využitím technik strojového učení pro dolování znalostí z textových dat související s migrační krizí. Data představují články a jejich komentáře ze zpravodajského portálu idnes.cz. V rámci práce jsou prozkoumané možnosti modelu Word2Vec pro problematiku dolování znalostí. Bylo navrženo a provedeno několik experimentů pro identifikaci a charakterizaci témat, kterými se autoři článků zabývají. Úplný záznam
	Analýza textových používateľských hodnotení vybranej skupiny produktov Valovič, Roman Tato práce se zaměřuje na návrh systému, který v textových recenzích produktů identifikuje často diskutované vlastnosti produktů, sumarizuje je a s ohledem na sentiment v přehledné formě zobrazí uživateli. V práci je rozebrána problematika zpracování přirozeného jazyka, se specifickým zaměřením na češtinu. Čtenář je kromě jiného seznámen s metodami preprocessingu textu a jejich vlivu na kvalitu výsledků analýzy. Samotná identifikace diskutovaných vlastností probíhá primárně za pomoci shlukové analýzy s využitím algoritmu K-Means, kde předpokládáme, že dostatečně vnitřně homogenní shluky budou představovat jednotlivé vlastnosti produktů. Novou oblastí, která bude v této práci prozkoumána, je reprezentace dokumentů pomocí techniky Word embeddings a z ní vyplývající možnosti využití vektorového prostoru jako vstupu pro algoritmy strojového učení. Úplný záznam
	Rozpoznání pojmenovaných entit v textu Süss, Martin Tato práce se zabývá rozpoznáváním pojmenovaných entit v textu, které je realizované technikami strojového učení. V nedávné době byly představeny techniky vytváření modelů vektorových reprezentací slov, které dokáží do vektorů zakódovat mnoho užitečných vztahů mezi slovy v textových datech, jako např. jejich syntaktickou či sémantickou podobnost. Moderní systémy pro rozpoznávání pojmenovaných entit tyto vlastnosti vektorů využívají, čímž výrazněji zlepšují svoji kvalitu. Málo z nich však detailněji zkoumá, jak velký vliv tyto vektory na rozpoznávání mají a jestli je lze optimalizovat pro ještě větší nárůst kvality rozpoznávání. Tato práce zkoumá různé faktory, které mohou ovlivnit kvalitu modelů vektorových reprezentací slov, a tím i výslednou kvalitu rozpoznávání pojmenovaných entit. V práci je vykonána série experimentů, které tyto faktory, jako je kvalita a velikost korpusu, počet dimenzí vektorů, techniky předzpracování textu či různé algoritmy (Word2Vec, GloVe a FastText) a specifické nastavení jejich parametrů, zkoumají. Jejich výsledky přinášejí řadu poznatků, které lze využít při vytváření vektorových reprezentací slov, a tím i nepřímo navýšit výslednou kvalitu rozpoznávání pojmenovaných entit. Úplný záznam
	Získavanie a analýza dát pre oblasť crowdfundingu Koštial, Martin Práce se zabývá získáváním dat z oblasti crowdfunding a jejich analýzou. Teoretická část je zaměřena na popis dostupných technologií a algoritmů pro analýzu dat. V praktické části je realizován sběr dat. Následně jsou v této části pro data aplikované algoritmy z oblasti data miningu a text miningu. Úplný záznam
	Biblické parafrázování Michálek, Ondřej ; Rosa, Rudolf (vedoucí práce) ; Barančíková, Petra (oponent) Název práce: Biblické parafrázování Autor: Ondřej Michálek Katedra / Ústav: Ústav formální a aplikované lingvistiky Vedoucí bakalářské práce: Mgr. Rudolf Rosa, Ph.D., Ústav formální a aplikované lingvistiky Abstrakt: Cílem této práce je vytvořit software, kterým zkusím zmodernizovat biblické texty pomocí parafráze na úrovni slov. Dalším cílem bude biblické texty parafrázovat pomocí specifických jazykových korpusů a pokusím se připodobnit biblické texty určité jazykové skupině, například odborné lékařské terminologii. Nakonec zkusím parafrázovat běžné texty jako je poezie, právo či úryvky novinových článků, zda budou znít po využití biblického modelu jako součástí dnešní bible. Parafrázování textů bude probíhat pomocí nástrojů Word2vec a MorphoDiTa a zanalyzuji užitečnost těchto nástrojů pro český jazyk a zvláště pak pro biblické texty. Klíčová slova: parafrázování, bible, korpusy textů, synonyma, Word2vec Úplný záznam
	Predicting novel drug-target interactions via deep learning techniques Frey, Adam ; Peška, Ladislav (vedoucí práce) ; Kratochvíl, Miroslav (oponent) Adam Frey Záměrem této práce bylo vyvinout model strojového učenı́ pro predikci in- terakcı́ mezi léky a bı́lkovinami v těle. Inspirována předchozı́mi metodami zaměřila se práce hlavně na metody typu "collaborative filtering" a hlubokého učenı́. Cı́lem bylo překonánı́ předchozı́ch modelů. Tento cı́l byl dosažen po- mocı́ série vylepšenı́ základnı́ho algoritmu faktorizace latentnich matic na rele- vantnı́m datasetu. Malé množstvı́ dat se aktuálně jevı́ jako bariéra pro využitı́ vı́ce sofistikovaných metod hlubokého učenı́. Hybridnı́ přistupy doporučovacı́ch systémů kombinujı́cı́ vı́cero typů dat se zdajı́ jako logický dalšı́ krok. Úplný záznam
	Shlukování slov podle významu Hošták, Viliam Samuel ; Otrusina, Lubomír (oponent) ; Smrž, Pavel (vedoucí práce) Táto práca sa zaoberá sémantickou podobnosťou slov. Popisuje a porovnáva existujúce modely, ktoré sa aktuálne pre tento účel používajú. Rozoberá návrh a implementáciu vytvoreného systému na predspracovanie textového korpusu, vytváranie sémantických modelov a vyhľadávanie sémanticky príbuzných slov. Vytvorený systém umožňuje prácu s distribučnými sémantickými modelmi Word2vec, FastText a GloVe. Úplný záznam
	Pokročilé metody strojového učení pro klasifikaci textu Dočekal, Martin ; Otrusina, Lubomír (oponent) ; Smrž, Pavel (vedoucí práce) Tato práce se zabývá pokročilými metodami strojového učení pro klasifikaci textu. Metody jsou nejprve popsány a poté je na základě těchto metod vytvořen systém sloužící pro klasifikaci textových dokumentů. Systém poskytuje také nástroje pro předzpracování dokumentů a hodnocení klasifikátoru. Práce uvádí použití systému na úloze v reálných podmínkách. Úplný záznam
	Word2vec modely s přidanou kontextovou informací Šůstek, Martin ; Rozman, Jaroslav (oponent) ; Zbořil, František (vedoucí práce) Tato práce se zabývá porozuměním word2vec modelů. Přestože tyto modely vznikly nedávno (2013), staly se velmi populárními. Učením těchto modelů lze obdržet vektorovou reprezentaci slov v~N-dimenzionálním prostoru reálných čísel. Pomocí operací nad těmito vektory je možné určit sémantické vazby mezi slovy. Dále se práce snaží o rozšíření představených modelů za účelem jiné reprezentace slov. K tomuto účelu je navrženo využití obrazové informace. Taktéž je diskutována možnost použití konvolučních neuronových sítí ve spojitosti s poskytnutím odlišné kontextové informace. Úplný záznam

Chcete být upozorněni, pokud se objeví nové záznamy odpovídající tomuto dotazu?
Přihlásit se k odběru RSS.

Digitální repozitář :: :: :: ::
Powered by v1.1.2
Spravuje

Tato stránka je dostupná také v následujících jazycích:
Česky English