Národní úložiště šedé literatury Nalezeno 38 záznamů.  začátekpředchozí29 - 38  přejít na záznam: Hledání trvalo 0.00 vteřin. 
Webové rozhraní pro platformu Treex
Sedlák, Michal ; Popel, Martin (vedoucí práce) ; Rosa, Rudolf (oponent)
Tato práce pojednává o webové aplikaci Treex::Web, která slouží jako webo- vé rozhraní k platformě pro zpracování úloh přirozeného jazyka Treex. Práce poukazuje na několik nedostatků Treexu (především absenci grafického uži- vatelského rozhraní a komplikovanou instalaci) a nabízí Treex::Web jako je- jich možné řešení. V úvodu práce je nejprve představena samotná platforma Treex. Následuje kapitola 3 popisující uživatelské rozhraní Treex::Webu a kapitola 4 zabývající se vlastní implementací webové aplikace. V závěru práce je provedeno srovnání s podobnými platformami jako Treex a jejich webovými rozhraními. 1
Nástroj pro porovnání a vyhodnocení strojového překladu
Klejch, Ondřej ; Popel, Martin (vedoucí práce) ; Tamchyna, Aleš (oponent)
Tato bakalářská práce se zabývá vývojem nástroje pro porovnávání a vyhod- nocování strojových překladů nazvaného MT-ComparEval. V tomto nástroji je možné porovnávat překlady na základě několika kritérií. Mezi ně patří automa- tické metriky kvality strojových překladů počítaných pro celé dokumenty nebo jednotlivé věty, porovnání kvality překladů jednotlivých vět pomocí zvýraznění potvrzených, zlepšujících a zhoršujících n-gramů nebo podle souhrnu nejvíce zlep- šujících a zhoršujících n-gramů v celém dokumentu. Při porovnávání dvou růz- ných překladů nástroj MT-ComparEval také vykresluje graf s absolutními rozdíly metrik počítaných pro jednotlivé věty a graf s hodnotami z párového bootstrap resamplingu.
Popularita osob automaticky
Hajič, Jan ; Bojar, Ondřej (vedoucí práce) ; Popel, Martin (oponent)
Možnost automaticky sledovat popularitu osob v~novinách by jistě uvítaly nejen tyto osoby samotné. Počítačové zpracovávání subjektivity je sice rychle se rozvíjející podobor komputační lingvistiky, v~češtině ovšem vůbec pro analýzu subjektivity a polarity v publicistice neexistují data. Začali jsme tedy s~tvorbou ručně anotovaného korpusu polarity z~českých publicistických textů, které se ovšem pro takové zpracování ukázaly jako krajně nevhodné. Dále jsme navrhli klasifikátor založený na statistických metodách, který by měl na základě tohoto korpusu popularitu sledovat, a otestovali jsme ho na korpusu recenzí bílého zboží a orientačně na zárodku našeho korpusu vět z~novinových článků. Jako model jsme použili automaticky extrahovaný unigramový slovník, tři příbuzné metody pro zjišťování polárních lemmat a množství filtrů pro selekci relevantních lemmat. Na recenzích bílého zboží jsme dosáhli výsledků srovnatelných se světovým výzkumem už se základním modelem, naopak u českých publicistických textů vidíme kvůli jejich charakteru možný příslib až u více lingvisticky orientovaných metod.
Hybrid Machine Translation Approaches for Low-Resource Languages
Kamran, Amir ; Popel, Martin (vedoucí práce) ; Kuboň, Vladislav (oponent)
V poslední době poskytují systémy automatického překladu založené na korpusových datech dobré výsledky pro celou řadu jazykových párů. Ty jazyky, pro které není k dispozici dostatek dat (jako např. Urdu), však při použití čistě statistických nebo příkladových metod dobré výsledky nemají. Na druhou stranu, metody založené na pravidlech vyžadují obrovské množství času a zdrojů pro vývoj pravidel, což je ve většině případů příliš náročné. Jedním z možných řešení se jeví hybridní systémy automatického překladu, ve kterých je možné kombinovat to nejlepší z různých přístupů za účelem dosažení kvalitního překladu. Tato práce zkoumá různé kombinace přístupů a vyhodnocuje jejich výkon v porovnání se standardně používanými korpusovými metodami. Zahrnuje: 1. Použití syntaktických a závislostních přerovnávacích pravidel v kombinaci se statistickým strojovým překladem. 2. Automatickou extrakci lexikálních a syntaktických pravidel využívající statistické metody pro strojový překlad prostřednictvím transferu. Novým prvkem je v této práci vývoj algoritmu, který se automaticky učí přerovnávací pravidla pro anglicko-urdský statistický automatický překlad. Tento přístup je navíc rozšířen na učení se lexikálních a syntaktických pravidel pro možné vybudování překladového systému založeného na pravidlech.
Word prediction using language models
Koutný, Michal ; Popel, Martin (vedoucí práce) ; Novák, Michal (oponent)
Práce využívá ngramových jazykových modelů k usnadnění zadávání textů pomocí QWERTY klávesnice předvídáním psaných slov. Nejprve jsou představena existující obdobná řešení a položen teoretický základ práce. Následující analýza dělí problém do čtyř částí: trénování modelů, využití modelů k predikci, GUI komponenta a nástroje pro hodnocení. Byly použity jazyky Python a C++. Použité textové korpusy jsou z české a anglické Wikipedie (19 a 84 miliónů slov), k testům přizůsobení je též použit malý český korpus vzdělávacích textů. Pomocí definovaných metrik jsou ohodnocena různá nastavení. Nejlepší výsledek pro testovací data byl 0.44, resp. 0.55 úhozů na znak pro angličtinu, resp. češtinu.
Feature Selection for Factored Phrase-Based Machine Translation
Tamchyna, Aleš ; Bojar, Ondřej (vedoucí práce) ; Popel, Martin (oponent)
V předkládané práci zkoumáme problematiku faktorových modelů ve strojovém překladu. Podáváme důkladný teoretický popis této oblasti strojového překladu. Popisujeme metodu sloužící ke zkoumání složitosti faktorových modelů a ověřujeme její fungování v praxi. Představujeme softwarový nástroj pro automatické vytváření experimentů strojového překladu a pro prohledávání prostoru možných konfigurací. V experimentální části pak ověřujeme svoje analýzy a podáváme obraz možností faktorových systémů. Naznačujeme směry, kterými lze dosáhnout zlepšení kvality strojového překladu, avšak shledáváme, že tyto možnosti nelze zkoumat zcela automaticky.
Metriky pro optimalizaci modelů strojového překladu
Macháček, Matouš ; Bojar, Ondřej (vedoucí práce) ; Popel, Martin (oponent)
Moderní automatické překladové systémy používají takzvaný loglineární model, který skládá dohromady více dílčích modelů a pomocí nich predikuje pravděpodobnost překladu dané věty. Každý dílčí model má v loglineárním modelu svojí váhu. Tyto váhy jsou dnes obecně optimalizovány na skóre automatické metriky BLEU, přestože jsou k dispozici i jiné metriky, z nichž některé korelují lépe s lidskými anotátory než metrika BLEU. V této práci zkoumáme ruzné metriky (PER, WER, CDER, TER, BLEU a SemPOS) z hlediska korelace s lidskými anotátory. Hloubeji se věnujeme metrice SemPOS a navrhujeme některé její aproximace a varianty. Uvedené metriky jsme použili v metodě MERT při optimalizaci překladového systému z angličtiny do češtiny a zkoumali jsme, jak optimalizování na ruzné automatické metriky ovlivní výslednou kvalitu systému. V rámci této práce jsme také některé metriky implementovali pro použití v metodě MERT.
Možnosti zlepšení strojového překladu z angličtiny do češtiny
Popel, Martin ; Bojar, Ondřej (oponent) ; Žabokrtský, Zdeněk (vedoucí práce)
Tato diplomová práce popisuje strojový překlad z angličtiny do češtiny implementovaný v systému TectoMT. Překlad je založen na transferu přes tektogramatickou rovinu a využívá anotační schéma Pražského závislostního korpusu.Prvotním cílem práce je zlepšení kvality překladu za pomoci pravidlového přístupu i statistických metod. Nejprve je popsána ruční anotace překladových chyb ve vzorku 250 vět a následná analýza častých typů chyb a jejich příčn. Hlavní část textu pak popisuje návrh a provedení úprav, které vedly k vylepšení tří fází překladu: analýzy, transferu a syntézy. Nejvýraznější inovací je využití stromové modi kace skrytých Markovových řetězců (Hidden Markov Tree Models) ve fázi transferu. Dosažené zlepšení je kvantitativně vyhodnoceno pomocí metrik BLEU a NIST.

Národní úložiště šedé literatury : Nalezeno 38 záznamů.   začátekpředchozí29 - 38  přejít na záznam:
Viz též: podobná jména autorů
1 POPEL, Milan
Chcete být upozorněni, pokud se objeví nové záznamy odpovídající tomuto dotazu?
Přihlásit se k odběru RSS.