Národní úložiště šedé literatury Nalezeno 4 záznamů.  Hledání trvalo 0.01 vteřin. 
Czech-English Translation
Petrželka, Jiří ; Schmidt, Marek (oponent) ; Smrž, Pavel (vedoucí práce)
This Master's thesis describes the principles of statistical machine translation and demonstrates how to assemble the Moses statistical machine translation system. In the preparation step, a research on freely available bilingual Czech-English corpora is done. An empirical analysis of time requirements of multithreaded word alignment tools demonstrates that MGIZA++ can achieve a five-fold speed-up, while PGIZA++ can reach an eight-fold speed-up (compared to GIZA++).Three scenarios of morphological pre-processing of Czech training data are tested, using simple unfactored models. While pure lemmatization can aggravate the BLEU, more sophisticated approaches usually raise BLEU. The positive effect of morphological pre-processing diminishes as corpus size rises. The relation between other corpora characteristics (size, genre, extra data) and the resulting BLEU are empirically gauged. A final system is trained on the CzEng 0.9 corpus and evaluated on the testing set from WMT 2010 workshop.
Diskurzní konektory v češtině.(Od centra k periferii)
Rysová, Magdaléna ; Hajičová, Eva (vedoucí práce) ; Malá, Markéta (oponent) ; Tárnyiková, Jarmila (oponent)
Magdaléna Rysová Diskurzní konektory v češtině (Od centra k periferii) Abstrakt V práci se zabýváme popisem a analýzou diskurzních (tj. textových) konektorů v češtině v širším smyslu, tedy tím, jakými jazykovými prostředky je možné vyjadřovat v textu diskurzní vztahy. Výzkum přitom neomezujeme na předem stanovenou skupinu výrazů (danou například příslušností k určitým slovním druhům, jako jsou spojky či strukturující částice), ale snažíme se nalézt a obecně popsat všechny jazykové prostředky v češtině, které mají schopnost spojovat jednotlivé úseky textu v jeden koherentní celek. Zaměřujeme se především na méně probádané víceslovné konektivní struktury typu to je důvod, proč; kvůli těmto skutečnostem; z těchto důvodů atd., pro které užíváme označení sekundární konektory (za primární konektory považujeme především konektivní synsémantika typu však, nebo, a, ale, proto apod.). Diskurzní konektory jsou velmi obecně chápány jako jazykové výrazy, které mají v textu schopnost signalizovat různé sémanticko-pragmatické vztahy. Existuje ovšem mnoho jazykových teorií, které se v konkrétním popisu diskurzních konektorů výrazně liší. Neexistuje tedy jediná, obecně přijímaná definice těchto výrazů, o jejichž podstatě a charakteristice se v lingvistice vedou diskuze. Cílem této práce je na základě podrobného jazykového...
Diskurzní konektory v češtině.(Od centra k periferii)
Rysová, Magdaléna ; Hajičová, Eva (vedoucí práce) ; Malá, Markéta (oponent) ; Tárnyiková, Jarmila (oponent)
Magdaléna Rysová Diskurzní konektory v češtině (Od centra k periferii) Abstrakt V práci se zabýváme popisem a analýzou diskurzních (tj. textových) konektorů v češtině v širším smyslu, tedy tím, jakými jazykovými prostředky je možné vyjadřovat v textu diskurzní vztahy. Výzkum přitom neomezujeme na předem stanovenou skupinu výrazů (danou například příslušností k určitým slovním druhům, jako jsou spojky či strukturující částice), ale snažíme se nalézt a obecně popsat všechny jazykové prostředky v češtině, které mají schopnost spojovat jednotlivé úseky textu v jeden koherentní celek. Zaměřujeme se především na méně probádané víceslovné konektivní struktury typu to je důvod, proč; kvůli těmto skutečnostem; z těchto důvodů atd., pro které užíváme označení sekundární konektory (za primární konektory považujeme především konektivní synsémantika typu však, nebo, a, ale, proto apod.). Diskurzní konektory jsou velmi obecně chápány jako jazykové výrazy, které mají v textu schopnost signalizovat různé sémanticko-pragmatické vztahy. Existuje ovšem mnoho jazykových teorií, které se v konkrétním popisu diskurzních konektorů výrazně liší. Neexistuje tedy jediná, obecně přijímaná definice těchto výrazů, o jejichž podstatě a charakteristice se v lingvistice vedou diskuze. Cílem této práce je na základě podrobného jazykového...
Czech-English Translation
Petrželka, Jiří ; Schmidt, Marek (oponent) ; Smrž, Pavel (vedoucí práce)
This Master's thesis describes the principles of statistical machine translation and demonstrates how to assemble the Moses statistical machine translation system. In the preparation step, a research on freely available bilingual Czech-English corpora is done. An empirical analysis of time requirements of multithreaded word alignment tools demonstrates that MGIZA++ can achieve a five-fold speed-up, while PGIZA++ can reach an eight-fold speed-up (compared to GIZA++).Three scenarios of morphological pre-processing of Czech training data are tested, using simple unfactored models. While pure lemmatization can aggravate the BLEU, more sophisticated approaches usually raise BLEU. The positive effect of morphological pre-processing diminishes as corpus size rises. The relation between other corpora characteristics (size, genre, extra data) and the resulting BLEU are empirically gauged. A final system is trained on the CzEng 0.9 corpus and evaluated on the testing set from WMT 2010 workshop.

Chcete být upozorněni, pokud se objeví nové záznamy odpovídající tomuto dotazu?
Přihlásit se k odběru RSS.