Original title:
Zarovnávání paralelních textů
Translated title:
Parallel Text Alignment
Authors:
Kadlček, Filip ; Grézl, František (referee) ; Smrž, Pavel (advisor) Document type: Bachelor's theses
Year:
2008
Language:
cze Publisher:
Vysoké učení technické v Brně. Fakulta informačních technologií Abstract:
[cze][eng]
Tato práce se zabývá zarovnáváním paralelních textů. V první části popisuje přístupy k zarovnávání a některé nástroje na zarovnávání. V práci je nejprve jednoduše popsáno statistické zarovnávání, a dále je popsáno zarovnávání s využitím slovníku, jež je hlavním tématem této práce. V další částii práce je uveden princip slovníkového zarovnávání a také ukázka zarovnání dat na vybraném vzorku dat. V závěru práce jsou shrnuty získané výsledky a také návhy na budoucí rozvoj v daném tématu.
This thesis is concerned to align parallel corpus. In the first part of thesis are describe acceses to align and some tool to align. As first describe a statistical align, but the main part is specialize to align with use dictionary, which is the main part of this thesis. In the midle part is introduce the princip of dictionary align and a simple example of align. At the end of work are sumarize obtained results and are noted proposals for future develop.
Keywords:
align; Corpus; distionary align; Giza; lemma; morphology; morphology analyse; parallel corpus; parallel text alignment; statistic align; Giza; Korpus; lemma; morfologická analýza; morfologie; paralelní korpus; slovník; slovníkové zarovnávání; statistické zarovnávání; zarovnávání; zarovnávání paralelních textů
Institution: Brno University of Technology
(web)
Document availability information: Fulltext is available in the Brno University of Technology Digital Library. Original record: http://hdl.handle.net/11012/55562