National Repository of Grey Literature 13 records found  1 - 10next  jump to record: Search took 0.01 seconds. 
Czech-Slovak Statistical Machine Translation
Astaloš, Lukáš ; Kouřil, Jan (referee) ; Smrž, Pavel (advisor)
The aim of this thesis is to design, implement and evaluate the translation system capable of translating texts from Czech to Slovak language. It describes theoretical foundations of statistical machine translation and then the phase of design and development of system. The chosen strategy was to build phrase-based translation model using one large parallel corpus in combination with language model from local institute of linguistics. The statistical machine translation Moses was used to achieve this goal. The vocabulary translation of unknown words using stemming was proposed and tested. Precision of build system was evaluated with BLEU score and it achieved comparable results with other systems.
Czech-Slovak Machine Translation
Kadlec, Peter ; Kouřil, Jan (referee) ; Smrž, Pavel (advisor)
Aim of this bachelor thesis was to get familiar with methods used in automatic machine translation, design and implement system for translation from czech to slovak and in the end with help of standard metrics score the created system.
Effectiveness of Machine Translation
Kvapil, Lukáš ; Reich, Pavel (referee) ; Kotásek, Miroslav (advisor)
Práce hodnotí strojový překlad z hlediska problémů kterým čelí, popisuje nejčastější metody a přístupy a s pomocí praktických ukázkek překladů, hodnotí, kvality a možností využití. Problémem jsou v první řadě odlišnosti mezi jazyky, které mohou mít odlišnou flexi, mluvnické kategorie nebo slovosled, a jsou tedy vyžadovány metody, které by tyto morfologické, gramatické a syntaktické odlišnosti zohledňovali. Další problémy jsou na úrovni sémantiky, kde musí překladače správně identifikovat význam slova a zvolit vhodný překlad. Ovšem možnosti porozumění významu jakožto i zohledňování kontextu jsou u počítačů omezené, stejně tak jako větší překladatelská rozhodnutí ohledně celého textu. Úspěšné řešení těchto problémů by vyžadovalo kompletní umělou inteligenci, která však v současnosti není k dispozici. Nejvyšší úrovně umělé inteligence dosahují patrně překladače, používající neuronové sítě, což je nejmodernější metoda strojového překladu, kterou již používají i některé běžně dostupné internetové překladače. Praktická ukázka na několika typech textů, přeložených z Angličtiny do Češtiny a naopak pomocí Google Translate ukázala, že strojový překlad pomocí neuronových sítí se velice úspěšně vypořádává s množstvím jazykových odlišností a dovede překládat termíny a delší fráze, stále ovšem produkuje množství chyb často bez předvídatelné příčiny a jeho chování je celkově nekonzistentí a citlivé na změny. Doposud tedy neexistuje universální systém, který by byl schopen plně automatického překladu vysoké kvality. Aplikace strojového překladu je vždy omezena buď sníženou kvalitou textu, nebo nutností návrhu systému pouze pro specifický účel a omezené pole působnosti. Strojový překlad tedy může zvyšovat efektivitu překladu jako takového pří nutnosti lidského zapojení, ale v dohledné době nenahradí lidské překladatele.
Czech-English Translation
Petrželka, Jiří ; Schmidt, Marek (referee) ; Smrž, Pavel (advisor)
Tato diplomová práce popisuje principy statistického strojového překladu a demonstruje, jak sestavit systém pro statistický strojový překlad Moses. V přípravné fázi jsou prozkoumány volně dostupné bilingvní česko-anglické korpusy. Empirická analýza časové náročnosti vícevláknových nástrojů pro zarovnání slov demonstruje, že MGIZA++ může dosáhnout až pětinásobného zrychlení, zatímco PGIZA++ až osminásobného zrychlení (v porovnání s GIZA++). Jsou otestovány tři způsoby morfologického pre-processingu českých trénovacích dat za použití jednoduchých nefaktorových modelů. Zatímco jednoduchá lemmatizace může snížit BLEU, sofistikovanější přístupy většinou BLEU zvyšují. Positivní efekty morfologického pre-processingu se vytrácejí s růstem velikosti korpusu. Vztah mezi dalšími charakteristikami korpusu (velikost, žánr, další data) a výsledným BLEU je empiricky měřen. Koncový systém je natrénován na korpusu CzEng 0.9 a vyhodnocen na testovacím vzorku z workshopu WMT 2010.
Evaluation of SMT translation systems (Google translate, Bing) from Italian to Czech: names of trees
MAKOVCOVÁ, Veronika
The topic of this thesis is an evaluation of SMT translation systems Google Translate and Bing from Italian to Czech: names of trees. In the first part the field of computational linguistics is briefly presented. Then the machine translation is summarized in general and historically and classified by various points of view. Its two most important approaches, rule-based and statistical, are also described. Two online translators, Google Translate and Bing, which use the statistical approach are presented as well. The practical part evaluates results provided by the two translators while translating names of trees from Italian to Czech according to selected criteria.
Pivoting Machine Translation for Vietnamese
Hoang, Duc Tam ; Bojar, Ondřej (advisor) ; Novák, Michal (referee)
Czech and Vietnamese are the national languages of the Czech Republic and Vietnam, re- spectively. The distinctive features and the shortage of resources renders Czech-Vietnamese machine translation into a difficult task, leading to the fact that no effort has been put into developing a translation tool specifically for the language pair. In this thesis, we develop phrase-based statistical machine translation systems for the language pair and investigate the potential to improve the translation quality with pivoting. Pivoting refers to a set of ma- chine translation approaches through which a natural language, called pivoting language, is introduced to solve the problem of data scarcity between source and target languages, one of the most challenging problems of statistical machine translation. Selecting English as the sole pivoting language for Czech-Vietnamese translation, we prepare training and test- ing corpora for the three language pairs. All possible corpus sources are explored regarding each specific language pair. The next step is to improve quality of the training corpora through normalizing and filtering. Various experiments with pivoting methods are carried out to analyse the performance of pivoting methods in a realistic working condition.
Effectiveness of Machine Translation
Kvapil, Lukáš ; Reich, Pavel (referee) ; Kotásek, Miroslav (advisor)
Práce hodnotí strojový překlad z hlediska problémů kterým čelí, popisuje nejčastější metody a přístupy a s pomocí praktických ukázkek překladů, hodnotí, kvality a možností využití. Problémem jsou v první řadě odlišnosti mezi jazyky, které mohou mít odlišnou flexi, mluvnické kategorie nebo slovosled, a jsou tedy vyžadovány metody, které by tyto morfologické, gramatické a syntaktické odlišnosti zohledňovali. Další problémy jsou na úrovni sémantiky, kde musí překladače správně identifikovat význam slova a zvolit vhodný překlad. Ovšem možnosti porozumění významu jakožto i zohledňování kontextu jsou u počítačů omezené, stejně tak jako větší překladatelská rozhodnutí ohledně celého textu. Úspěšné řešení těchto problémů by vyžadovalo kompletní umělou inteligenci, která však v současnosti není k dispozici. Nejvyšší úrovně umělé inteligence dosahují patrně překladače, používající neuronové sítě, což je nejmodernější metoda strojového překladu, kterou již používají i některé běžně dostupné internetové překladače. Praktická ukázka na několika typech textů, přeložených z Angličtiny do Češtiny a naopak pomocí Google Translate ukázala, že strojový překlad pomocí neuronových sítí se velice úspěšně vypořádává s množstvím jazykových odlišností a dovede překládat termíny a delší fráze, stále ovšem produkuje množství chyb často bez předvídatelné příčiny a jeho chování je celkově nekonzistentí a citlivé na změny. Doposud tedy neexistuje universální systém, který by byl schopen plně automatického překladu vysoké kvality. Aplikace strojového překladu je vždy omezena buď sníženou kvalitou textu, nebo nutností návrhu systému pouze pro specifický účel a omezené pole působnosti. Strojový překlad tedy může zvyšovat efektivitu překladu jako takového pří nutnosti lidského zapojení, ale v dohledné době nenahradí lidské překladatele.
Evaluation of SMT translation systems (Google translate, Bing) from French to Czech: collocations related to "Waste management"
VÍŠKOVÁ, Barbora
This bachelor thesis is focused on a Evaluation of SMT translation systems (Google Translate, Bing) from French to Czech: collocations related to "Waste management". At first, the work describes a brief history of machine translation. Then the work describes the basic principles of machine translation like the rule-based machine transla-tion, the statistical machine translation, the hybrid machine translation and the by com-puter aided translation. The online translators GT and MB are introduced as well. These translators are completed by specific studies of correctness their evaluations. The automatic translations of these tranlators are evaluated on the based of outlined typology of resulting mistakes. These automatic translations are the most important ob-ject of this bachelor thesis.
Evaluation of SMT translation systems (Google translate, Bing) from French to Czech: collocations related to "Food safety"
ŠVARCOVÁ, Zora
The aim of this bachelor thesis is to test and evaluate the translation quality of selected terminological collocations related to "food safety" using free available translators (Microsoft Bing Translator, Google Translate). The work is divided into two parts theoretical and practical. Theoretical part is divided into several chapters, which focus on the development, history and use of statistical machine translation, the basic strategies of machine translation systems (rule-based machine translation, statistical machine translation, hybrid machine translation and computer-aided translation). Furthermore, the first part deals with the history and characteristic of two online translators Microsoft Bing Translator and Google Translate. Finally, there is a brief description of the term "collocation ". Practical part is focused on the evaluation of translations of selected collations, whose quality is evaluated by comparison with the available terminology databases (IATE).
Czech-Slovak Statistical Machine Translation
Astaloš, Lukáš ; Kouřil, Jan (referee) ; Smrž, Pavel (advisor)
The aim of this thesis is to design, implement and evaluate the translation system capable of translating texts from Czech to Slovak language. It describes theoretical foundations of statistical machine translation and then the phase of design and development of system. The chosen strategy was to build phrase-based translation model using one large parallel corpus in combination with language model from local institute of linguistics. The statistical machine translation Moses was used to achieve this goal. The vocabulary translation of unknown words using stemming was proposed and tested. Precision of build system was evaluated with BLEU score and it achieved comparable results with other systems.

National Repository of Grey Literature : 13 records found   1 - 10next  jump to record:
Interested in being notified about new results for this query?
Subscribe to the RSS feed.