Národní úložiště šedé literatury Nalezeno 53 záznamů.  předchozí11 - 20dalšíkonec  přejít na záznam: Hledání trvalo 0.00 vteřin. 
Machine Translation of Related Asian Languages
Larasati, Septina Dian ; Kuboň, Vladislav (vedoucí práce) ; Petkevič, Vladimír (oponent)
This thesis presents the development of an MT system between Indonesian and Malaysian. The system uses a method of almost a direct translation exploiting the similarity of both languages. This method was previously used on a number of language pairs of European languages. The thesis also elaborates the attempts to make language resources from scratch since the languages are under-resourced.
Hybrid Machine Translation Approaches for Low-Resource Languages
Kamran, Amir ; Popel, Martin (vedoucí práce) ; Kuboň, Vladislav (oponent)
V poslední době poskytují systémy automatického překladu založené na korpusových datech dobré výsledky pro celou řadu jazykových párů. Ty jazyky, pro které není k dispozici dostatek dat (jako např. Urdu), však při použití čistě statistických nebo příkladových metod dobré výsledky nemají. Na druhou stranu, metody založené na pravidlech vyžadují obrovské množství času a zdrojů pro vývoj pravidel, což je ve většině případů příliš náročné. Jedním z možných řešení se jeví hybridní systémy automatického překladu, ve kterých je možné kombinovat to nejlepší z různých přístupů za účelem dosažení kvalitního překladu. Tato práce zkoumá různé kombinace přístupů a vyhodnocuje jejich výkon v porovnání se standardně používanými korpusovými metodami. Zahrnuje: 1. Použití syntaktických a závislostních přerovnávacích pravidel v kombinaci se statistickým strojovým překladem. 2. Automatickou extrakci lexikálních a syntaktických pravidel využívající statistické metody pro strojový překlad prostřednictvím transferu. Novým prvkem je v této práci vývoj algoritmu, který se automaticky učí přerovnávací pravidla pro anglicko-urdský statistický automatický překlad. Tento přístup je navíc rozšířen na učení se lexikálních a syntaktických pravidel pro možné vybudování překladového systému založeného na pravidlech.
Vyhodnocování podobnosti českých textů
Cvengroš, Petr ; Holan, Tomáš (vedoucí práce) ; Kuboň, Vladislav (oponent)
V předložené práci studujeme porovnávání dvou českých textů. Je popsán návrh a principy implementace programu na porovnávání dvou textů pomocí sady rozličných kritérií, nová kritéria se dají snadno přidávat. Program je schopen se učit, učení probíhá konfigurací programu na textech zadaných uživatelem. V první části práce se zabýváme popisem algoritmů pro porovnávání textů a učení. Další část je věnována zajímavým částem implementace. V závěru se popisuje využití programu na reálných textech.
Implementace metod analýzy struktury českých souvětí.
Dutkevič, Jiří ; Kuboň, Vladislav (vedoucí práce) ; Holan, Tomáš (oponent)
Název práce: Implementace metod analýzy struktury českých souvětí. Autor: Jiří Dutkevič Katedra / Ústav: Ústav formální a aplikované lingvistiky Vedoucí bakalářské práce: doc. RNDr. Vladislav Kuboň, Ph.D., Ústav formální a aplikované lingvistiky Abstrakt: Práce se zabývá automatickou analýzou struktur souvětí v češtině. Shrnuje výsledky předchozího výzkumu, užívá v něm navržené metody rozdělení souvětí do segmentů pomocí přesně definované množiny separátorů a na základě přednesených pravidel navrhuje tři metody automatického určování úrovní jednotlivých segmentů v souvětí a tím i jejich vzájemných vztahů. Jedna metoda přímo využívá pravidel navržených v odkazovaném výzkumu, druhá používá genetický algoritmus a třetí neuronovou síť. Práce obsahuje implementaci těchto metod a vyhodnocení výsledků na ručně anotovaných datech z Pražského závislostního korpusu.
Deep analysis in IQA: evaluation on real users dialogues.
Ratkovic, Zorana ; Kuboň, Vladislav (vedoucí práce) ; Hoffmannová, Petra (oponent)
Interactive Question Answering (IQA) is a natural and cohesive way for a user to obtain information by interactive with a system using natural language. With the advancement in Natural Language Processing, research in the eld of IQA has started to focus on the role of semantics and the discourse structure in these systems. The need for a deeper analysis, which examines the syntax and semantics of the questions and the answers is evident. Using this deeper analysis allows us to model the context of the interaction. I will look at a current closeddomain IQA system which is based on Linear Regression modeling. This system uses super cial and non-semantically motivated features. I propose adding deep analysis and semantic features in order to improve the system and show the need for such analysis. Particular attention will be placed on the so-called follow-up questions (questions that the user poses after having received some answer from the system) and the role of context. I propose that adding the linguistically heavy features will prove bene cial, thereby showing the need for such analysis in IQA systems.
Automatické hodnocení kvality paralelních dvojjazyčných dat
Kolovratník, David ; Kuboň, Vladislav (vedoucí práce) ; Pecina, Pavel (oponent)
Statistický strojový překlad je metoda závislá zejména na velkém množství paralelních dvojjazyčných dat. Ty se používa jí pro trénování překladového modelu. Ten pak zastupuje úlohu pravidlového transferu, v některých systémech lexikálního. Věří se, že kvalitu překladu lze zlepšovat přidáváním trénovacích dat. Zkusil jsem naopak trénovací data zmenčovat a sledovat, jak se bude vyvíjet hodnocení překladu. Větné páry, které zůstanou ve zmeněném korpusu jsem vybíral postupně podle těch růných klíčů jednou náhodně, jednou podle poměru délek vět a nakonec podle počtu párů slov, které zná slovník jako překladové ekvivalenty. Ukázal jsem, že nejenže vhodný výběr větných párů do menšího korpusu zpomalí pokles NIST a BLEU ho dno cení se zmenšujícím se korpusem, ale dokonce může vést k lepšímu hodnocení. Zmenšení trénovacích dat vedlo také ke zrychlení vyhodnocení a nižším nárokům na prostor. To může být užitečné při implementaci strojového překladu v malých zařízeních s omezenými systémovými prostředky.
Semantic relation extraction from unstructured data in the business domain
Rampula, Ilana ; Pecina, Pavel (vedoucí práce) ; Kuboň, Vladislav (oponent)
V posledních letech se využití textové analytiky v komerční sféřě postupně stává významým tématem pro vědecké a praktické aplikace. Zaměřili jsme se na určování vztahů mezi entitami z dat dodaných partnerskou společností. Analýza textu z této sféry ale vyžaduje jiný přístup: počítání s nepřesnostma a specifickými atributy. V této práci jsme se rozhodli ukázat využití dvou metod pro určování vztahů: tzv. Snowball systém a Metodu vzdáleného dohledu (z angl. Distant Supervision), které jsme přizpůsobili pro dodaná data. Dané metody byli implementovány pro využití strukturovaných a nestrukturovaných dat z firemní databáze. Klíčová slova: Získavání informací, Určování vztahů mezi entitami, Textová analytika, Distant Supervision, Snowball
Measures of Machine Translation Quality
Macháček, Matouš ; Bojar, Ondřej (vedoucí práce) ; Kuboň, Vladislav (oponent)
Název práce: Měření kvality strojového překladu Autor: Matouš Macháček Ústav: Ústav formální a aplikované lingvistiky Vedoucí diplomové práce: RNDr. Ondřej Bojar, Ph.D. Abstrakt: V této práci zkoumáme manuální i automatické metody pro vy- hodnocování kvality strojového překladu. Navrhujeme manuální metodu evaluace, ve které anotátoři hodnotí místo celých vět pouze krátké úseky strojového překladu, což zjednodušuje a zefektivňuje anotaci. Provedli jsme anotační experiment a vyhodnotili jsme systémy strojového překladu podle této metody. Získané výsledky jsou velmi podobné těm z oficiálního vy- hodnocení systémů v rámci sotěže WMT14. Získanou databázi anotací dále používáme k evaluaci nových, neviděných systémů a k ladění parametrů stati- stického strojového překladače. Evaluace nových systémů ale dává nepřesné výsledky a v práci proto analyzujeme důvody tohoto neúspěchu. V rámci zkoumání automatických metod evaluace jsme dvakrát po sobě organizovali soutěž strojových metrik v rámci workshopu WMT. V této práci uvádíme výsledky z poslední soutže, diskutujeme různé metody metaevaluace a ana- lyzujeme některé zúčastněné metriky. Klíčová slova: strojový překlad, vyhodnocování kvality,...
Iterativní zdokonalování přepisu zvukových nahrávek s využitím zpětné vazby posluchačů
Krůza, Jan Oldřich ; Kuboň, Vladislav (vedoucí práce) ; Müller, Luděk (oponent) ; Pollák, Petr (oponent)
Iterativní zdokonalování přepisu zvukových nahrávek s využitím zpětné vazby posluchačů Abstrakt Tato disertační práce se zabývá zpřístupněním zvukových záznamů jednoho mluv- čího úzké i široké veřejnosti. Motivací práce byla existence chátrajících nahrávek hovorů českého filozofa ing. Karla Makoně na kazetách a kotoučích. Cílem je zachování materiálu pro bu- doucí generace a zpřístupnění nahrávek pomocí digitálních technologií, především přístupnosti nahrávek na internetu a možnosti vyhledávání v nich. Práce představuje tvorbu systému pro přepis velké sady zvukových záznamů se zapojením laické komunity. Navržené řešení spočívá ve vytvoření základního přepisu nízké kvality pomocí automatického rozpoznávání řeči a vyvinutí aplikace, která umožní od členů komunity i nahodilých zájemců získávat opravy automa- tického přepisu, použitelné jako trénovací data pro další zlepšování. Popíše se samotný mluvený korpus. Představí se autor a jeho dílo, témata v nahrávkách, nahrávání samotné, digitalizace a získané přepisy. Dále se rozvede tvorba systému pro automatický přepis korpusu od sběru dat, přes akustické a jazykové modelování, různé provedené experimenty až k vyhodnocení úspěšnosti. V neposlední řadě se popíše webová aplikace pro sběr manuálních přepisů. Zmíní se odlišnosti od ostatních systémů, detaily návrhu a...
Artificial Neural Network for Opinion Target Identification in Czech
Glončák, Vladan ; Kuboň, Vladislav (vedoucí práce) ; Mírovský, Jiří (oponent)
Hlavným cieľom práce je využitie neurónových sietí, presnejšie sietí s pamäťovými bunkami LSTM, na identifikáciu cieľov hodnotení v českom jazyku. Ako vedľajší produkt vznikla pri vypracovávaní nová verzia českého datasetu pre identifikáciu cieľov hodnotení. Dosiahnuté výsledky pre české dáta sme porovnali s už známymi výsledkami dosiahnutými v minulosti pre iné jazyky. Celkovo sa dá povedať, že experiment bol úspešný, podarilo sa nám prekonať triviálny východiskový model a dosiahnuť výsledky porovnateľné s predošlými výsledkami. Powered by TCPDF (www.tcpdf.org)

Národní úložiště šedé literatury : Nalezeno 53 záznamů.   předchozí11 - 20dalšíkonec  přejít na záznam:
Chcete být upozorněni, pokud se objeví nové záznamy odpovídající tomuto dotazu?
Přihlásit se k odběru RSS.