Národní úložiště šedé literatury Nalezeno 11 záznamů.  1 - 10další  přejít na záznam: Hledání trvalo 0.01 vteřin. 
Mutual Relation of Machine Translation and Quality Estimation
Tryhubyshyn, Iryna ; Tamchyna, Aleš (vedoucí práce) ; Popel, Martin (oponent)
Odhad kvality strojového překladu předpovídá skóre kvality pro překlady vytvořené systémy strojového překladu na vstupních a výstupních segmentů. Systémy odhadu kval- ity jsou trénované pomoci učení s učitelem pomocí trénovacích dat, která obsahují překlad vytvořený jedním nebo více systémy strojového překladu. Výběr trénovacích dat pro stro- jový překlad má tedy vliv na to, jak dobře funguje systém odhadu kvality. Tato práce studuje vztah mezi systémy strojového překladu a systémy pro odhad kvality na úrovni vět. S využitím našich definic výkonu systému strojového překladu a výkonu systému odhadu kvality jsme provedli experimenty, které zahrnují trénovaní sys- témů strojového překladu a odhadu kvality různých výkonů. Prezentovali jsme výsledky hodnocení systémů odhadu kvality na testovacích sadách různých domén překládáných strojovými překládačí různé síly. Zjistili jsme, že (i) systémy hodnocení kvality vyškolené na překladech nižší kvality mají vyšší výkon, než systémy hodnocení kvality trénované na překladech vyšší kvality; (ii) hodnocení vysoce kvalitních systémů strojového překladu je výzvou pro systémy hodnocení kvality všech výkonů; (iii) vysoce výkonné systémy pro odhad kvality fungují lépe pro domény odlišné od trénovací, než systémy pro odhad kvality s nízkým výkonem 1
Nástroj pro porovnání a vyhodnocení strojového překladu
Klejch, Ondřej ; Popel, Martin (vedoucí práce) ; Tamchyna, Aleš (oponent)
Tato bakalářská práce se zabývá vývojem nástroje pro porovnávání a vyhod- nocování strojových překladů nazvaného MT-ComparEval. V tomto nástroji je možné porovnávat překlady na základě několika kritérií. Mezi ně patří automa- tické metriky kvality strojových překladů počítaných pro celé dokumenty nebo jednotlivé věty, porovnání kvality překladů jednotlivých vět pomocí zvýraznění potvrzených, zlepšujících a zhoršujících n-gramů nebo podle souhrnu nejvíce zlep- šujících a zhoršujících n-gramů v celém dokumentu. Při porovnávání dvou růz- ných překladů nástroj MT-ComparEval také vykresluje graf s absolutními rozdíly metrik počítaných pro jednotlivé věty a graf s hodnotami z párového bootstrap resamplingu.
Přibližná extrakce frázové tabulky z velkého paralelního korpusu
Przywara, Česlav ; Bojar, Ondřej (vedoucí práce) ; Tamchyna, Aleš (oponent)
Cílem této práce je ověření praktické použitelnosti algoritmu pro přibližné počítání četností jako základu pro implementaci filtru frázových tabulek v systémech pro statistický strojový překlad. Algoritmus navíc dokáže odstranit fráze s nízkou četností přímo během extrakce tabulky. Provedená implementace umožnila vytvářet značně filtrované tabulky, které však v měřeních kvality překladu pomocí automatické metriky BLEU dosahovaly obdobných skóre jako nefiltrované tabulky. Důležitým výsledkem této práce je plně funkční program pro extrakci frázových tabulek, pojmenovaný eppex, schopný nahradit stávající programy se stejnou funkčností, jež jsou součástí volně šířitelného systému pro statistický strojový překlad Moses. Značná část práce je věnována experimentálnímu vyhodnocení systémových nároků programu a kvality vytvářených frázových tabulek, při kterém jsou jako trénovací data použity paralelní korpusy o celkové velikosti 2 miliard slov. Powered by TCPDF (www.tcpdf.org)
Feature Selection for Factored Phrase-Based Machine Translation
Tamchyna, Aleš ; Bojar, Ondřej (vedoucí práce) ; Popel, Martin (oponent)
V předkládané práci zkoumáme problematiku faktorových modelů ve strojovém překladu. Podáváme důkladný teoretický popis této oblasti strojového překladu. Popisujeme metodu sloužící ke zkoumání složitosti faktorových modelů a ověřujeme její fungování v praxi. Představujeme softwarový nástroj pro automatické vytváření experimentů strojového překladu a pro prohledávání prostoru možných konfigurací. V experimentální části pak ověřujeme svoje analýzy a podáváme obraz možností faktorových systémů. Naznačujeme směry, kterými lze dosáhnout zlepšení kvality strojového překladu, avšak shledáváme, že tyto možnosti nelze zkoumat zcela automaticky.
Lexical and Morphological Choices in Machine Translation
Tamchyna, Aleš ; Bojar, Ondřej (vedoucí práce) ; Čmejrek, Martin (oponent) ; Rosen, Alexandr (oponent)
Práce se zabývá dvěma problémy strojového překladu: lexikální volbou a morfologií v cílovém jazyce. První úlohou je správné přenesení významu ze zdrojového jazyka do cílového. Druhá úloha, která hraje roli především při překladu do tvaroslovně bohatých jazyků, je pak správná volba povrchové formy u cílových lexémů. Tyto úlohy řešíme v rámci frázového strojového překladu. Navrhujeme diskriminativní překladový model, který využívá lingvisticky motivované rysy extrahované jak ze zdrojového, tak z cílového kontextu. Ukazujeme, že tento model řeší konkrétní slabiny standardních frázových systémů. Pomocí řady experimentů pak dokládáme, že model konzistentně zlepšuje kvalitu výsledného překladu. Vedle tohoto hlavního příspěvku popisujeme analýzy, ruční anotace a experimenty zaměřené především na anglicko-český překlad.
Detection of Intensity in Sentiment Analysis of Czech
Dargaj, Jakub ; Tamchyna, Aleš (vedoucí práce) ; Mareček, David (oponent)
Postojová analýza sa zaoberá automatickou extrakciou subjektívnych informácií z textu. Cieľom práce je predpovedať intenzitu postoja v českých textoch. Na riešenie tejto úlohy sme pripravili dataset filmových hodnotení užívateľov Česko-Slovenskej filmovej databázy. Porovnávame niekoľko metód strojového učenia, pričom sa zameriavame na extrakciu číselných atribútov z textových dát. S využitím konvolučných neurónových sietí a korpusovo závislého trénovania vektorových reprezentácií slov sa nám podarilo prekonať základné modely a dosiahnuť presnosť podobnú najnovším výsledkom v tejto oblasti. V práci taktiež analyzujeme model logistickej regresie na porovnanie použitých jazykových prostriedkov medzi recenziami s rôznymi stupňami hodnotenia.
Nástroj pro porovnání a vyhodnocení strojového překladu
Klejch, Ondřej ; Popel, Martin (vedoucí práce) ; Tamchyna, Aleš (oponent)
Tato bakalářská práce se zabývá vývojem nástroje pro porovnávání a vyhod- nocování strojových překladů nazvaného MT-ComparEval. V tomto nástroji je možné porovnávat překlady na základě několika kritérií. Mezi ně patří automa- tické metriky kvality strojových překladů počítaných pro celé dokumenty nebo jednotlivé věty, porovnání kvality překladů jednotlivých vět pomocí zvýraznění potvrzených, zlepšujících a zhoršujících n-gramů nebo podle souhrnu nejvíce zlep- šujících a zhoršujících n-gramů v celém dokumentu. Při porovnávání dvou růz- ných překladů nástroj MT-ComparEval také vykresluje graf s absolutními rozdíly metrik počítaných pro jednotlivé věty a graf s hodnotami z párového bootstrap resamplingu.
Přibližná extrakce frázové tabulky z velkého paralelního korpusu
Przywara, Česlav ; Bojar, Ondřej (vedoucí práce) ; Tamchyna, Aleš (oponent)
Cílem této práce je ověření praktické použitelnosti algoritmu pro přibližné počítání četností jako základu pro implementaci filtru frázových tabulek v systémech pro statistický strojový překlad. Algoritmus navíc dokáže odstranit fráze s nízkou četností přímo během extrakce tabulky. Provedená implementace umožnila vytvářet značně filtrované tabulky, které však v měřeních kvality překladu pomocí automatické metriky BLEU dosahovaly obdobných skóre jako nefiltrované tabulky. Důležitým výsledkem této práce je plně funkční program pro extrakci frázových tabulek, pojmenovaný eppex, schopný nahradit stávající programy se stejnou funkčností, jež jsou součástí volně šířitelného systému pro statistický strojový překlad Moses. Značná část práce je věnována experimentálnímu vyhodnocení systémových nároků programu a kvality vytvářených frázových tabulek, při kterém jsou jako trénovací data použity paralelní korpusy o celkové velikosti 2 miliard slov. Powered by TCPDF (www.tcpdf.org)
Feature Selection for Factored Phrase-Based Machine Translation
Tamchyna, Aleš ; Bojar, Ondřej (vedoucí práce) ; Popel, Martin (oponent)
V předkládané práci zkoumáme problematiku faktorových modelů ve strojovém překladu. Podáváme důkladný teoretický popis této oblasti strojového překladu. Popisujeme metodu sloužící ke zkoumání složitosti faktorových modelů a ověřujeme její fungování v praxi. Představujeme softwarový nástroj pro automatické vytváření experimentů strojového překladu a pro prohledávání prostoru možných konfigurací. V experimentální části pak ověřujeme svoje analýzy a podáváme obraz možností faktorových systémů. Naznačujeme směry, kterými lze dosáhnout zlepšení kvality strojového překladu, avšak shledáváme, že tyto možnosti nelze zkoumat zcela automaticky.

Národní úložiště šedé literatury : Nalezeno 11 záznamů.   1 - 10další  přejít na záznam:
Chcete být upozorněni, pokud se objeví nové záznamy odpovídající tomuto dotazu?
Přihlásit se k odběru RSS.