Original title:
Rekonstrukce pořadí slov ve větách
Translated title:
Word order reconstruction
Authors:
Dvořák, Tomáš ; Vidová Hladká, Barbora (advisor) ; Mírovský, Jiří (referee) Document type: Bachelor's theses
Year:
2011
Language:
cze Abstract:
[cze][eng] Rekonstrukcí původního pořadí slov věty je v této práci myšleno přerovnání slov věty takovým způsobem, aby vznikla gramaticky korektní věta v daném jazyce. Rekonstrukce původního pořadí slov ve větách je velice užitečná část au- tomatického zpracování přirozeného jazyka počítačem, která může nalézt široké uplatnění. Především velice důležitou roli hraje při automatickém překladu přirozeného jazyka, rozpoznávání řeči nebo při konstrukci umělých komunikačních partnerů. Řešení této úlohy je korpusově orientované a při řešení jsou použity dva přístupy: morfologický a syntaktický. Každý přístup využívá výstup externího modulu, který poskytuje požadované morfologické či syntaktické informace. Re- konstrukční procedura je navržena tak, aby byla jazykove nezávislá. Cílovými jazyky jsou čeština a angličtina. 1A word order reconstruction is a re-arrangement of words to get a gramma- tically correct sentence. It is a very useful task for the applications of natural language processing, machine translation, speech recognition or construction artificial communication partners. We present a corpus-based approach to the task of word order reconstruction. We use two methods: morfological and syntactical method. Both methods use output from the external module. This approach is designed independently on the application where the word order reconstruction can help improve overall performance. Czech and English will be used as the object language. 1
Keywords:
corpora; morphological analysis; syntactical analysis; word order; korpusy; morfologická analýza; pořadí slov ve větě; syntaktická analýza
Institution: Charles University Faculties (theses)
(web)
Document availability information: Available in the Charles University Digital Repository. Original record: http://hdl.handle.net/20.500.11956/38441