Národní úložiště šedé literatury Nalezeno 8 záznamů.  Hledání trvalo 0.00 vteřin. 
Automatic post-editing of phrase-based machine translation outputs
Rosa, Rudolf ; Mareček, David (vedoucí práce) ; Žabokrtský, Zdeněk (oponent)
Představujeme Depfix, systém pro samočinnou post-edititaci výstupů frázových strojových překladů z angličtiny do češtiny, založený na jazykovědných znalostech. Nejprve jsme rozebrali druhy chyb, kterých se dopouští typický strojový překladač. Poté jsme vytvořili sadu pravidel a statistickou komponentu, které opravují takové chyby, které jsou běžné nebo závažné a může přicházet v úvahu jejich oprava pomocí našeho přístupu. Používáme řadu nástrojů pro zpracování přirozeného jazyka, které nám poskytují rozbor vstupních vět. Navíc jsme reimplementovali závislostní analyzátor a několika způsoby jej upravili pro provádění rozboru výstupů statistických strojových překladačů. Provedli jsme automatická i ruční vyhodnocení, která potvrdila, že kvalita překladů se zpracováním v našem systému zlepšuje.
Sumarizace českých textů z více zdrojů
Brus, Tomáš ; Bojar, Ondřej (vedoucí práce) ; Mareček, David (oponent)
Diplomová práce se zabývá problémem sumarizace sady článků na dané téma. Rozebírá několik možných způsobů sestavování sumarizace a způsoby vyhodnocení jejich výsledků. Součástí práce je implementace popsaných algoritmů a jejich aplikace na vybrané texty. Ty pocházejí z~českých zpravodajských webových serverů a jsou reprezentovány formálně pomocí hloubkové syntaxe (tektogramatická rovina).
Webové rozhraní pro platformu Treex
Sedlák, Michal ; Popel, Martin (vedoucí práce) ; Rosa, Rudolf (oponent)
Tato práce pojednává o webové aplikaci Treex::Web, která slouží jako webo- vé rozhraní k platformě pro zpracování úloh přirozeného jazyka Treex. Práce poukazuje na několik nedostatků Treexu (především absenci grafického uži- vatelského rozhraní a komplikovanou instalaci) a nabízí Treex::Web jako je- jich možné řešení. V úvodu práce je nejprve představena samotná platforma Treex. Následuje kapitola 3 popisující uživatelské rozhraní Treex::Webu a kapitola 4 zabývající se vlastní implementací webové aplikace. V závěru práce je provedeno srovnání s podobnými platformami jako Treex a jejich webovými rozhraními. 1
Automatic Error Correction of Machine Translation Output
Variš, Dušan ; Bojar, Ondřej (vedoucí práce) ; Mareček, David (oponent)
Představujeme MLFix, systém pro automatickou statistickou post-editaci, který je duchovním následníkem pravidlového systému, Depfixu. Cílem této práce bylo prozkoumat možné postupy automatické identifikace nejčastějších morfologických chyb tvořených současnými systémy pro strojový překlad a natrénovat vhodné statistické modely, které by byly postaveny na získaných znalostech. Provedli jsme automatickou i ruční evaluaci našeho systému a výsledky porovnali s Depfixem. Systém byl vyvíjen především na výstupech anglicko-českého strojového překladu, cílem ale bylo zobecnit post-editační proces tak, aby byl aplikovatelný na další jazykové páry. Upravili jsme původní pipeline, aby post-editovala výstupy anglicko-německého strojového překladu, a provedli dodatečnou evaluaci této modifikace. Powered by TCPDF (www.tcpdf.org)
Automatic Error Correction of Machine Translation Output
Variš, Dušan ; Bojar, Ondřej (vedoucí práce) ; Mareček, David (oponent)
Představujeme MLFix, systém pro automatickou statistickou post-editaci, který je duchovním následníkem pravidlového systému, Depfixu. Cílem této práce bylo prozkoumat možné postupy automatické identifikace nejčastějších morfologických chyb tvořených současnými systémy pro strojový překlad a natrénovat vhodné statistické modely, které by byly postaveny na získaných znalostech. Provedli jsme automatickou i ruční evaluaci našeho systému a výsledky porovnali s Depfixem. Systém byl vyvíjen především na výstupech anglicko-českého strojového překladu, cílem ale bylo zobecnit post-editační proces tak, aby byl aplikovatelný na další jazykové páry. Upravili jsme původní pipeline, aby post-editovala výstupy anglicko-německého strojového překladu, a provedli dodatečnou evaluaci této modifikace. Powered by TCPDF (www.tcpdf.org)
Automatic post-editing of phrase-based machine translation outputs
Rosa, Rudolf ; Mareček, David (vedoucí práce) ; Žabokrtský, Zdeněk (oponent)
Představujeme Depfix, systém pro samočinnou post-edititaci výstupů frázových strojových překladů z angličtiny do češtiny, založený na jazykovědných znalostech. Nejprve jsme rozebrali druhy chyb, kterých se dopouští typický strojový překladač. Poté jsme vytvořili sadu pravidel a statistickou komponentu, které opravují takové chyby, které jsou běžné nebo závažné a může přicházet v úvahu jejich oprava pomocí našeho přístupu. Používáme řadu nástrojů pro zpracování přirozeného jazyka, které nám poskytují rozbor vstupních vět. Navíc jsme reimplementovali závislostní analyzátor a několika způsoby jej upravili pro provádění rozboru výstupů statistických strojových překladačů. Provedli jsme automatická i ruční vyhodnocení, která potvrdila, že kvalita překladů se zpracováním v našem systému zlepšuje.
Webové rozhraní pro platformu Treex
Sedlák, Michal ; Popel, Martin (vedoucí práce) ; Rosa, Rudolf (oponent)
Tato práce pojednává o webové aplikaci Treex::Web, která slouží jako webo- vé rozhraní k platformě pro zpracování úloh přirozeného jazyka Treex. Práce poukazuje na několik nedostatků Treexu (především absenci grafického uži- vatelského rozhraní a komplikovanou instalaci) a nabízí Treex::Web jako je- jich možné řešení. V úvodu práce je nejprve představena samotná platforma Treex. Následuje kapitola 3 popisující uživatelské rozhraní Treex::Webu a kapitola 4 zabývající se vlastní implementací webové aplikace. V závěru práce je provedeno srovnání s podobnými platformami jako Treex a jejich webovými rozhraními. 1
Sumarizace českých textů z více zdrojů
Brus, Tomáš ; Bojar, Ondřej (vedoucí práce) ; Mareček, David (oponent)
Diplomová práce se zabývá problémem sumarizace sady článků na dané téma. Rozebírá několik možných způsobů sestavování sumarizace a způsoby vyhodnocení jejich výsledků. Součástí práce je implementace popsaných algoritmů a jejich aplikace na vybrané texty. Ty pocházejí z~českých zpravodajských webových serverů a jsou reprezentovány formálně pomocí hloubkové syntaxe (tektogramatická rovina).

Chcete být upozorněni, pokud se objeví nové záznamy odpovídající tomuto dotazu?
Přihlásit se k odběru RSS.