Národní úložiště šedé literatury Nalezeno 53 záznamů.  začátekpředchozí20 - 29dalšíkonec  přejít na záznam: Hledání trvalo 0.01 vteřin. 
Artificial Neural Network for Opinion Target Identification in Czech
Glončák, Vladan ; Kuboň, Vladislav (vedoucí práce) ; Mírovský, Jiří (oponent)
Hlavným cieľom práce je využitie neurónových sietí, presnejšie sietí s pamäťovými bunkami LSTM, na identifikáciu cieľov hodnotení v českom jazyku. Ako vedľajší produkt vznikla pri vypracovávaní nová verzia českého datasetu pre identifikáciu cieľov hodnotení. Dosiahnuté výsledky pre české dáta sme porovnali s už známymi výsledkami dosiahnutými v minulosti pre iné jazyky. Celkovo sa dá povedať, že experiment bol úspešný, podarilo sa nám prekonať triviálny východiskový model a dosiahnuť výsledky porovnateľné s predošlými výsledkami. Powered by TCPDF (www.tcpdf.org)
Kontextově závislý slovník pro překladatele
Fanta, Petr ; Bojar, Ondřej (vedoucí práce) ; Kuboň, Vladislav (oponent)
Při ručním překládání krátkých textů, jaké se vyskytují například na sociálních sítích, či mikroblozích (Twitter a podobně), je překladatel často nucen dohledávat doplňující informace v různých zdrojích. Může se jednat o méně běžná slova, o specifické termíny z neznámé domény, či o různé zkratky. V této práci se zabýváme návrhem a implementací systému, který pro danou krátkou textovou zprávu automaticky sestaví minimální kontextově závislý slovník. Systém v překládaném textu vybírá vhodná hesla do slovníku a vyhledává k nim definice, překlady a příklady v otevřených zdrojích, či je automaticky extrahuje z paralelního korpusu. Získaný slovníček v ideálním případě bude pro překladatele již dostačujícím podkladem, aby překládanou zprávu s jistotou pochopil a zvolil odpovídající překladové ekvivalenty včetně odborných termínů. Empirické vyhodnocení se opírá o statistiky sledující, jak často byli uživatelé s navrženými hesly spokojeni, jak často byla hesla chybná a do jaké míry systém správně určil relevanci pro daný vstupní text.
Iterativní zdokonalování přepisu zvukových nahrávek s využitím zpětné vazby posluchačů
Krůza, Jan Oldřich ; Kuboň, Vladislav (vedoucí práce)
Iterativní zdokonalování přepisu zvukových nahrávek s využitím zpětné vazby posluchačů Abstrakt Tato disertační práce se zabývá zpřístupněním zvukových záznamů jednoho mluv- čího úzké i široké veřejnosti. Motivací práce byla existence chátrajících nahrávek hovorů českého filozofa ing. Karla Makoně na kazetách a kotoučích. Cílem je zachování materiálu pro bu- doucí generace a zpřístupnění nahrávek pomocí digitálních technologií, především přístupnosti nahrávek na internetu a možnosti vyhledávání v nich. Práce představuje tvorbu systému pro přepis velké sady zvukových záznamů se zapojením laické komunity. Navržené řešení spočívá ve vytvoření základního přepisu nízké kvality pomocí automatického rozpoznávání řeči a vyvinutí aplikace, která umožní od členů komunity i nahodilých zájemců získávat opravy automa- tického přepisu, použitelné jako trénovací data pro další zlepšování. Popíše se samotný mluvený korpus. Představí se autor a jeho dílo, témata v nahrávkách, nahrávání samotné, digitalizace a získané přepisy. Dále se rozvede tvorba systému pro automatický přepis korpusu od sběru dat přes akustické a jazykové modelování, různé provedené experimenty až k vyhodnocení úspěšnosti. V neposlední řadě se popíše webová aplikace pro sběr manuálních přepisů. Zmíní se odlišnosti od ostatních systémů, detaily návrhu a...
Iterativní zdokonalování přepisu zvukových nahrávek s využitím zpětné vazby posluchačů
Krůza, Jan Oldřich ; Kuboň, Vladislav (vedoucí práce) ; Müller, Luděk (oponent) ; Pollák, Petr (oponent)
Iterativní zdokonalování přepisu zvukových nahrávek s využitím zpětné vazby posluchačů Abstrakt Tato disertační práce se zabývá zpřístupněním zvukových záznamů jednoho mluv- čího úzké i široké veřejnosti. Motivací práce byla existence chátrajících nahrávek hovorů českého filozofa ing. Karla Makoně na kazetách a kotoučích. Cílem je zachování materiálu pro bu- doucí generace a zpřístupnění nahrávek pomocí digitálních technologií, především přístupnosti nahrávek na internetu a možnosti vyhledávání v nich. Práce představuje tvorbu systému pro přepis velké sady zvukových záznamů se zapojením laické komunity. Navržené řešení spočívá ve vytvoření základního přepisu nízké kvality pomocí automatického rozpoznávání řeči a vyvinutí aplikace, která umožní od členů komunity i nahodilých zájemců získávat opravy automa- tického přepisu, použitelné jako trénovací data pro další zlepšování. Popíše se samotný mluvený korpus. Představí se autor a jeho dílo, témata v nahrávkách, nahrávání samotné, digitalizace a získané přepisy. Dále se rozvede tvorba systému pro automatický přepis korpusu od sběru dat, přes akustické a jazykové modelování, různé provedené experimenty až k vyhodnocení úspěšnosti. V neposlední řadě se popíše webová aplikace pro sběr manuálních přepisů. Zmíní se odlišnosti od ostatních systémů, detaily návrhu a...
Předpovídání trendů akciového trhu z novinových článků
Serebryannikova, Anastasia ; Kuboň, Vladislav (vedoucí práce) ; Vidová Hladká, Barbora (oponent)
In this work we made an attempt to predict the upwards/downwards movement of the S&P 500 index from the news articles published by Bloomberg and Reuters. We employed the SVM classifier and conducted multiple experiments aiming at understanding the shape of the data and the specifics of the task better. As a result, we established the common evaluation settings for all our subsequent experiments. After that we tried incorporating various features into the model and also replicated several approaches previously suggested in the literature. We were able to identify some non-trivial dependencies in the data which helped us achieve a high accuracy on the development set. However, none of the models that we built showed comparable performance on the test set. We have come to the conclusion that whereas some trends or patterns can be identified in a particular dataset, such findings are usually barely transferable to other data. The experiments that we conducted support the idea that the stock market is changing at random and a high quality of prediction may only be achieved on particular sets of data and under very special settings, but not for the task of stock market prediction in general. 1
Srovnání (a historická podmíněnost) výstupů ze strojových překladačů
Kyselová, Soňa ; Svoboda, Tomáš (vedoucí práce) ; Kuboň, Vladislav (oponent)
Předmětem této diplomové práce je strojový překlad, jehož výzkumu se lingvistika (a později i translatologie) věnuje poměrně dlouho a který se v posledních letech dostal i do popředí zájmu širší veřejnosti. Cílem této práce je postihnout vývoj kvality výstupů z veřejně dostupných překladačů v čase. Teoretická část se proto nejprve zabývá strojovým překladem obecně, tedy základními definicemi, stručnou historií a možnými přístupy, poté jsou představeny veřejně dostupné online překladače a metody hodnocení kvality strojového překladu. V závěru této části je popsán metodologický model pro část empirickou. V empirické části se na vzorku překladů vyhotovených s využitím veřejně dostupných online překladačů ověřuje, jak se vybrané překladače vypořádají s jednotlivými textovými typy a zda dochází ke zlepšení kvality výstupů v čase. Za tímto účelem je provedena jak translatologická analýza překladů, která zohledňuje textový typ, sémantickou, lexikální, stylistickou a pragmatickou rovinu, tak hodnocení na stupnici za účelem zhodnocení celkové použitelnosti překladu. V závěru práce jsou porovnány a shrnuty výsledky empirické studie. Na základě tohoto srovnání jsou vyvozeny závěry a nastíněny obecné tendence vyplývající z empirické části práce.
Artificial Neural Network for Opinion Target Identification in Czech
Glončák, Vladan ; Kuboň, Vladislav (vedoucí práce) ; Mírovský, Jiří (oponent)
Hlavným cieľom práce je využitie neurónových sietí, presnejšie sietí s pamäťovými bunkami LSTM, na identifikáciu cieľov hodnotení v českom jazyku. Ako vedľajší produkt vznikla pri vypracovávaní nová verzia českého datasetu pre identifikáciu cieľov hodnotení. Dosiahnuté výsledky pre české dáta sme porovnali s už známymi výsledkami dosiahnutými v minulosti pre iné jazyky. Celkovo sa dá povedať, že experiment bol úspešný, podarilo sa nám prekonať triviálny východiskový model a dosiahnuť výsledky porovnateľné s predošlými výsledkami. Powered by TCPDF (www.tcpdf.org)
Linguistic Issues in Machine Translation between Czech and Russian
Klyueva, Natalia ; Kuboň, Vladislav (vedoucí práce) ; Panevová, Jarmila (oponent) ; Strossa, Petr (oponent)
V této disertační práci zkoumáme strojový překlad mezi češtinou a ruštinou z hlediska lingvisty. Pracujeme s několika pravidlovými a statistickými překladovými systémy a pomocí změn v jejích nastavení se snážíme dosáhnout co nejlepších výsledků překladu. Jedna z otázek, které řešíme v naší práci, je nakolik příbuznost obou jazyků pomáhá strojovému překladu. Hlavním cílem práce je lingvistický rozbor chyb ve výstupu čtyř systémů strojového překladu, dvou experimentálních - TectoMT, Moses, a dvou komerčních - PC Translator a Google Translate. Analyzujeme každý typ chyb a řešíme, zda daná chyba souvisí s rozdílem mezi češtinou a ruštinou nebo zda je zapříčiněná architecturou jednotlivých systémů. Pro některé chyby nabízíme cesty, jak je opravit. Ve zvláštní kapitole se zaměřujeme na chyby v povrchové valenci sloves. Zkoumáme rozdíly v české a ruské povrchové valenci, popisujeme extrakci slovníku povrchových forem a tento slovník integrujeme do systému TectoMT. Dále nabízíme souhrn lingvistických pozorování o povaze rozdílů v české a ruské valenci. Powered by TCPDF (www.tcpdf.org)
Semantic relation extraction from unstructured data in the business domain
Rampula, Ilana ; Pecina, Pavel (vedoucí práce) ; Kuboň, Vladislav (oponent)
V posledních letech se využití textové analytiky v komerční sféřě postupně stává významým tématem pro vědecké a praktické aplikace. Zaměřili jsme se na určování vztahů mezi entitami z dat dodaných partnerskou společností. Analýza textu z této sféry ale vyžaduje jiný přístup: počítání s nepřesnostma a specifickými atributy. V této práci jsme se rozhodli ukázat využití dvou metod pro určování vztahů: tzv. Snowball systém a Metodu vzdáleného dohledu (z angl. Distant Supervision), které jsme přizpůsobili pro dodaná data. Dané metody byli implementovány pro využití strukturovaných a nestrukturovaných dat z firemní databáze. Klíčová slova: Získavání informací, Určování vztahů mezi entitami, Textová analytika, Distant Supervision, Snowball

Národní úložiště šedé literatury : Nalezeno 53 záznamů.   začátekpředchozí20 - 29dalšíkonec  přejít na záznam:
Chcete být upozorněni, pokud se objeví nové záznamy odpovídající tomuto dotazu?
Přihlásit se k odběru RSS.