Original title:
Japonsko-český strojový překlad
Translated title:
Japanese-Czech Machine Translation
Authors:
Variš, Dušan ; Bojar, Ondřej (advisor) ; Popel, Martin (referee) Document type: Bachelor's theses
Year:
2014
Language:
cze Abstract:
[cze][eng] Strojový překlad s použitím hloubkového větného rozboru není v současné době ve srovnání s jinými metodami tolik rozšířen, věříme však, že některé jeho aspekty jsou schopny přispět k zlepšení kvality strojového překladu. Je přitom důležité vyzkoušet danou metodu pro různé jazykové páry, v našem případě se jednalo o dvojici japonština-čeština. Nedílnou součástí tohoto úkolu je i získání a zpracování potřebných paralelních dat. Kvůli malému množství těchto dat jsme se snažili vyzkoušet různé postupy, které by nám pomohly potřebná data nahradit. Náš systém je založen na stejném principu jako anglicko- český překladač TectoMT, v rámci této práce jsme jej implementovali do stejného prostředí. Snažili jsme se přitom zachytit alespoň základní jazykové jevy charakteristické pro japonštinu. Při zkoumání našeho systému jsme jej porovnávali s jednoduchým frázovým překladačem. Powered by TCPDF (www.tcpdf.org)Machine translation (MT) using deep sentence analysis is not as widespread as other MT methods, however we believe that some of its aspects can contribute to the overall translation quality. It is also important to try out deep MT methods with various language pairs. In our case, we experiment with the language pair Japanese-Czech. As a part of this task, we also had to collect and process necessary parallel data. Due to a very small amount of such data being available, we were forced to devise aproaches tackling this problem. Our system is based on the same principles as the TectoMT translation system, therefore it was implemented within the same platform. In the process, we tried to capture at least some basic linguistic phenomena characteristic for Japanese. As a part of our research, we also compared our system with a simple phrase-based baseline. Powered by TCPDF (www.tcpdf.org)
Keywords:
Japanese-Czech; machine translation; natural language processing; tectogrammatical layer; japonština-čeština; strojový překlad; tektogramatická rovina; zpracování přirozeného jazyka
Institution: Charles University Faculties (theses)
(web)
Document availability information: Available in the Charles University Digital Repository. Original record: http://hdl.handle.net/20.500.11956/71508