Národní úložiště šedé literatury Nalezeno 25 záznamů.  předchozí11 - 20další  přejít na záznam: Hledání trvalo 0.01 vteřin. 
Biblické parafrázování
Michálek, Ondřej ; Rosa, Rudolf (vedoucí práce) ; Barančíková, Petra (oponent)
V této bakalářské práci se zabývám parafrázováním textu na úrovni slov, konkrétně parafrázováním biblických textů v češtině. Součástí parafráze by měla být i modernizace textu, aby se stal srozumitelnějším pro běžného čtenáře. Pro tyto účely jsem vyvinul desktopovou uživatelskou aplikaci, ve které využívám nástroje pro analýzu a generování jazyka: Word2vec a MorphoDiTu. Ve své práci porovnávám výsledky jednotlivých přístupů v parafrázování. Vyhodnocení výsledků sleduje několik kritérií a porovnávám účinnost použitých metod na verších z Bible kralické a Českého ekumenického překladu.
Dolování znalostí z textových dat související s migrační krizí
Koukal, Filip
Tato bakalářská práce se zabývá využitím technik strojového učení pro dolování znalostí z textových dat související s migrační krizí. Data představují články a jejich komentáře ze zpravodajského portálu idnes.cz. V rámci práce jsou prozkoumané možnosti modelu Word2Vec pro problematiku dolování znalostí. Bylo navrženo a provedeno několik experimentů pro identifikaci a charakterizaci témat, kterými se autoři článků zabývají.
Analýza textových používateľských hodnotení vybranej skupiny produktov
Valovič, Roman
Tato práce se zaměřuje na návrh systému, který v textových recenzích produktů identifikuje často diskutované vlastnosti produktů, sumarizuje je a s ohledem na sentiment v přehledné formě zobrazí uživateli. V práci je rozebrána problematika zpracování přirozeného jazyka, se specifickým zaměřením na češtinu. Čtenář je kromě jiného seznámen s metodami preprocessingu textu a jejich vlivu na kvalitu výsledků analýzy. Samotná identifikace diskutovaných vlastností probíhá primárně za pomoci shlukové analýzy s využitím algoritmu K-Means, kde předpokládáme, že dostatečně vnitřně homogenní shluky budou představovat jednotlivé vlastnosti produktů. Novou oblastí, která bude v této práci prozkoumána, je reprezentace dokumentů pomocí techniky Word embeddings a z ní vyplývající možnosti využití vektorového prostoru jako vstupu pro algoritmy strojového učení.
Rozpoznání pojmenovaných entit v textu
Süss, Martin
Tato práce se zabývá rozpoznáváním pojmenovaných entit v textu, které je realizované technikami strojového učení. V nedávné době byly představeny techniky vytváření modelů vektorových reprezentací slov, které dokáží do vektorů zakódovat mnoho užitečných vztahů mezi slovy v textových datech, jako např. jejich syntaktickou či sémantickou podobnost. Moderní systémy pro rozpoznávání pojmenovaných entit tyto vlastnosti vektorů využívají, čímž výrazněji zlepšují svoji kvalitu. Málo z nich však detailněji zkoumá, jak velký vliv tyto vektory na rozpoznávání mají a jestli je lze optimalizovat pro ještě větší nárůst kvality rozpoznávání. Tato práce zkoumá různé faktory, které mohou ovlivnit kvalitu modelů vektorových reprezentací slov, a tím i výslednou kvalitu rozpoznávání pojmenovaných entit. V práci je vykonána série experimentů, které tyto faktory, jako je kvalita a velikost korpusu, počet dimenzí vektorů, techniky předzpracování textu či různé algoritmy (Word2Vec, GloVe a FastText) a specifické nastavení jejich parametrů, zkoumají. Jejich výsledky přinášejí řadu poznatků, které lze využít při vytváření vektorových reprezentací slov, a tím i nepřímo navýšit výslednou kvalitu rozpoznávání pojmenovaných entit.
Získavanie a analýza dát pre oblasť crowdfundingu
Koštial, Martin
Práce se zabývá získáváním dat z oblasti crowdfunding a jejich analýzou. Teoretická část je zaměřena na popis dostupných technologií a algoritmů pro analýzu dat. V praktické části je realizován sběr dat. Následně jsou v této části pro data aplikované algoritmy z oblasti data miningu a text miningu.
Biblické parafrázování
Michálek, Ondřej ; Rosa, Rudolf (vedoucí práce) ; Barančíková, Petra (oponent)
Název práce: Biblické parafrázování Autor: Ondřej Michálek Katedra / Ústav: Ústav formální a aplikované lingvistiky Vedoucí bakalářské práce: Mgr. Rudolf Rosa, Ph.D., Ústav formální a aplikované lingvistiky Abstrakt: Cílem této práce je vytvořit software, kterým zkusím zmodernizovat biblické texty pomocí parafráze na úrovni slov. Dalším cílem bude biblické texty parafrázovat pomocí specifických jazykových korpusů a pokusím se připodobnit biblické texty určité jazykové skupině, například odborné lékařské terminologii. Nakonec zkusím parafrázovat běžné texty jako je poezie, právo či úryvky novinových článků, zda budou znít po využití biblického modelu jako součástí dnešní bible. Parafrázování textů bude probíhat pomocí nástrojů Word2vec a MorphoDiTa a zanalyzuji užitečnost těchto nástrojů pro český jazyk a zvláště pak pro biblické texty. Klíčová slova: parafrázování, bible, korpusy textů, synonyma, Word2vec
Predicting novel drug-target interactions via deep learning techniques
Frey, Adam ; Peška, Ladislav (vedoucí práce) ; Kratochvíl, Miroslav (oponent)
Adam Frey Záměrem této práce bylo vyvinout model strojového učenı́ pro predikci in- terakcı́ mezi léky a bı́lkovinami v těle. Inspirována předchozı́mi metodami zaměřila se práce hlavně na metody typu "collaborative filtering" a hlubokého učenı́. Cı́lem bylo překonánı́ předchozı́ch modelů. Tento cı́l byl dosažen po- mocı́ série vylepšenı́ základnı́ho algoritmu faktorizace latentnich matic na rele- vantnı́m datasetu. Malé množstvı́ dat se aktuálně jevı́ jako bariéra pro využitı́ vı́ce sofistikovaných metod hlubokého učenı́. Hybridnı́ přistupy doporučovacı́ch systémů kombinujı́cı́ vı́cero typů dat se zdajı́ jako logický dalšı́ krok.
Shlukování slov podle významu
Hošták, Viliam Samuel ; Otrusina, Lubomír (oponent) ; Smrž, Pavel (vedoucí práce)
Táto práca sa zaoberá sémantickou podobnosťou slov. Popisuje a porovnáva existujúce modely, ktoré sa aktuálne pre tento účel používajú. Rozoberá návrh a implementáciu vytvoreného systému na predspracovanie textového korpusu, vytváranie sémantických modelov a vyhľadávanie sémanticky príbuzných slov. Vytvorený systém umožňuje prácu s distribučnými sémantickými modelmi Word2vec, FastText a GloVe.
Pokročilé metody strojového učení pro klasifikaci textu
Dočekal, Martin ; Otrusina, Lubomír (oponent) ; Smrž, Pavel (vedoucí práce)
Tato práce se zabývá pokročilými metodami strojového učení pro klasifikaci textu. Metody jsou nejprve popsány a poté je na základě těchto metod vytvořen systém sloužící pro klasifikaci textových dokumentů. Systém poskytuje také nástroje pro předzpracování dokumentů a hodnocení klasifikátoru. Práce uvádí použití systému na úloze v reálných podmínkách.
Word2vec modely s přidanou kontextovou informací
Šůstek, Martin ; Rozman, Jaroslav (oponent) ; Zbořil, František (vedoucí práce)
Tato práce se zabývá porozuměním word2vec modelů. Přestože tyto modely vznikly nedávno (2013), staly se velmi populárními. Učením těchto modelů lze obdržet vektorovou reprezentaci slov v~N-dimenzionálním prostoru reálných čísel. Pomocí operací nad těmito vektory je možné určit sémantické vazby mezi slovy. Dále se práce snaží o rozšíření představených modelů za účelem jiné reprezentace slov. K tomuto účelu je navrženo využití obrazové informace. Taktéž je diskutována možnost použití konvolučních neuronových sítí ve spojitosti s poskytnutím odlišné kontextové informace.

Národní úložiště šedé literatury : Nalezeno 25 záznamů.   předchozí11 - 20další  přejít na záznam:
Chcete být upozorněni, pokud se objeví nové záznamy odpovídající tomuto dotazu?
Přihlásit se k odběru RSS.