Národní úložiště šedé literatury Nalezeno 25 záznamů.  1 - 10dalšíkonec  přejít na záznam: Hledání trvalo 0.01 vteřin. 
Shlukování slov podle významu
Haljuk, Petr ; Otrusina, Lubomír (oponent) ; Smrž, Pavel (vedoucí práce)
Tato bakalářská práce se zabývá sémantickou podobností slov. Popisuje návrh a implementaci systému, který vyhledává nejpodobnější slova a určuje sémantickou podobnost vět. Systém využívá model Word2Vec z knihovny GenSim . Vztahy mezi slovy se model učí analýzou korpusu CommonCrawl .
Word2vec modely s přidanou kontextovou informací
Šůstek, Martin ; Rozman, Jaroslav (oponent) ; Zbořil, František (vedoucí práce)
Tato práce se zabývá porozuměním word2vec modelů. Přestože tyto modely vznikly nedávno (2013), staly se velmi populárními. Učením těchto modelů lze obdržet vektorovou reprezentaci slov v~N-dimenzionálním prostoru reálných čísel. Pomocí operací nad těmito vektory je možné určit sémantické vazby mezi slovy. Dále se práce snaží o rozšíření představených modelů za účelem jiné reprezentace slov. K tomuto účelu je navrženo využití obrazové informace. Taktéž je diskutována možnost použití konvolučních neuronových sítí ve spojitosti s poskytnutím odlišné kontextové informace.
Shlukování slov podle významu
Hošták, Viliam Samuel ; Otrusina, Lubomír (oponent) ; Smrž, Pavel (vedoucí práce)
Táto práca sa zaoberá sémantickou podobnosťou slov. Popisuje a porovnáva existujúce modely, ktoré sa aktuálne pre tento účel používajú. Rozoberá návrh a implementáciu vytvoreného systému na predspracovanie textového korpusu, vytváranie sémantických modelov a vyhľadávanie sémanticky príbuzných slov. Vytvorený systém umožňuje prácu s distribučnými sémantickými modelmi Word2vec, FastText a GloVe.
Pokročilé metody strojového učení pro klasifikaci textu
Dočekal, Martin ; Otrusina, Lubomír (oponent) ; Smrž, Pavel (vedoucí práce)
Tato práce se zabývá pokročilými metodami strojového učení pro klasifikaci textu. Metody jsou nejprve popsány a poté je na základě těchto metod vytvořen systém sloužící pro klasifikaci textových dokumentů. Systém poskytuje také nástroje pro předzpracování dokumentů a hodnocení klasifikátoru. Práce uvádí použití systému na úloze v reálných podmínkách.
Shlukování slov podle významu
Jadrníček, Zbyněk ; Otrusina, Lubomír (oponent) ; Smrž, Pavel (vedoucí práce)
Tato práce se zabývá problémem sémantické podobnosti slov v angličtině. Čtenář je nejprve informován o teorii shlukování slov podle významu, poté jsou popsány některé metody a nástroje související s tématem. V praktické části navrhneme a implementujeme systém pro výpočet sémantické podobnosti slov využívající nástroj Word2Vec, konkrétně se zaměříme na biomedicínské texty z databáze MEDLINE. Na závěr práce budeme diskutovat dosažené výsledky a předložíme několik návrhů, jak systém vylepšit.
Určování blízkost pojmů v oblasti informačních technologií
Smutka, Miloslav ; Otrusina, Lubomír (oponent) ; Smrž, Pavel (vedoucí práce)
Tato bakalářská práce se zabývá návrhem, implementací a vyhodnocením výsledků systému pro vyhledávání sémanticky blízkých slov. Pro určení vztahů mezi slovy systém využívá model word2vec z knihovny gensim.
Nástroj pro rozpoznání a kontrolu objednávek spedice
Kalivoda, Vojtěch ; Hradiš, Michal (oponent) ; Herout, Adam (vedoucí práce)
Cílem této práce je návrh a implementace webového nástroje, který usnadní práci dispečerům spedičních a dopravních firem pomocí automatizovaného rozpoznání důležitých informací v objednávkách. Díky rozpoznání nemusí být všechny informace ručně přepisovány dispečery, což vede k ušetření času. Rozpoznávání objednávek je postaveno na vyhledání entit v dokumentu, reprezentace jejich okolí vektory za pomocí word2vec modelů a následné klasifikace pomocí konvolučních neuronových sítí. Nástroj dokáže v reálném čase rozpoznat 20 typů informací s průměrnou úspěšností 72.35~\%. V rámci práce byl shromážděn dataset necelých 1~700 objednávek a 141 z nich bylo anotováno. Součástí práce je webová aplikace, která slouží jako rozhraní pro nástroj a sběr dat.
Binární klasifikace zákaznických incidentů pomocí metod NLP
Pokorný, Jiří
Tato bakalářská práce se zabývá vybudováním modelu umožňujícího binární klasifikaci zákaznických incidentů v rámci systému SAP. Klasifikace je provedena pro věty obsažené v incidentech, dle čehož je určena konečná kategorie incidentu. Využitý text je v anglickém jazyce. Za účelem porovnání tradičních a moderních přístupů pro textovou klasifikaci, a získání optimálního výsledku, je provedena série experimentů obnášející využití různých metod vyvážení datasetu, vektorové reprezentace a klasifikačních algoritmů. Výsledky jsou v konečné řadě zhodnoceny a je zformulováno doporučení s ohledem na další rozvoj, včetně uplatnění získaných znalostí v prostředí SAP.
Nástroj pro rozpoznání a kontrolu objednávek spedice
Kalivoda, Vojtěch ; Hradiš, Michal (oponent) ; Herout, Adam (vedoucí práce)
Cílem této práce je návrh a implementace webového nástroje, který usnadní práci dispečerům spedičních a dopravních firem pomocí automatizovaného rozpoznání důležitých informací v objednávkách. Díky rozpoznání nemusí být všechny informace ručně přepisovány dispečery, což vede k ušetření času. Rozpoznávání objednávek je postaveno na vyhledání entit v dokumentu, reprezentace jejich okolí vektory za pomocí word2vec modelů a následné klasifikace pomocí konvolučních neuronových sítí. Nástroj dokáže v reálném čase rozpoznat 20 typů informací s průměrnou úspěšností 72.35~\%. V rámci práce byl shromážděn dataset necelých 1~700 objednávek a 141 z nich bylo anotováno. Součástí práce je webová aplikace, která slouží jako rozhraní pro nástroj a sběr dat.
Mining Parallel Corpora from the Web
Kúdela, Jakub ; Holubová, Irena (vedoucí práce)
Názov: Rafinácia paralelných korpusov z webu Autor: Bc. Jakub Kúdela E-mailová adresa autora: jakub.kudela@gmail.com Katedra: Katedra Softwarového Inženýrství Vedúci práce: Doc. RNDr. Irena Holubová, Ph.D. E-mailová adresa vedúceho: holubova@ksi.mff.cuni.cz Konzultant práce: RNDr. Ondřej Bojar, Ph.D. E-mailová adresa konzultanta: bojar@ufal.mff.cuni.cz Abstrakt: Štatistický strojový preklad (SMT, statistical machine translation) je v súčasnosti jeden z najpopulárnejších prístupov ku strojovému prekladu. Tento prístup využíva štatistické modely, ktorých parametre sú získané z analýzy para- lelných korpusov potrebných pre tréning. Existencia paralelného korpusu je naj- d^oležitejšou prerekvizitou pre vytvorenie účinného SMT prekladača. Viaceré vlas- nosti tohto korpusu, ako napríklad objem a kvalita, ovplyvňujú výsledky prekladu do značnej miery. Web m^ožeme považovat' za neustále rastúci zdroj značného množstva paralelných dát, ktoré m^ožu byt' rafinované a zahrnuté do trénovacieho procesu, čím m^ožu zdokonalit' výsledky SMT prekladača. Prvá čast' práce suma- rizuje niektoré z rozšírených metód pre získavanie paralelného korpusu z webu. Väčšina z metód hl'adá páry paralelných webových stránok podl'a podobnosti ich...

Národní úložiště šedé literatury : Nalezeno 25 záznamů.   1 - 10dalšíkonec  přejít na záznam:
Chcete být upozorněni, pokud se objeví nové záznamy odpovídající tomuto dotazu?
Přihlásit se k odběru RSS.