Original title:
Určování syntaktické smysluplnosti českých vět
Translated title:
Syntactically-based classification of Czech sentences
Authors:
Kríž, Vincent ; Mírovský, Jiří (referee) ; Vidová Hladká, Barbora (advisor) Document type: Bachelor's theses
Year:
2009
Language:
cze Abstract:
[cze][eng] Určovanie syntaktickej zmysluplnosti viet je zaujímavou a užitočnou úlohou v aplikáciách počítačového spracovania prirodzeného jazyka, napríklad v strojovom preklade, vyhľadávacích strojoch a v systémoch zodpovedania otázok. Teoretická lingvistika skúma prirodzený jazyk ako systém rovín. V našom projekte tento pohľad rešpektujeme a berieme do úvahy pri definovaní zmysluplnosti. Zmysluplnosť skúmame na základe morfologickej a syntaktickej roviny. V práci implementujeme znalostnú (pravidlovú) procedúru, ktorá o reťazci českých slov rozhodne, či je zmysluplný, alebo nie. Pred spustením procedúry bude reťazec slov analyzovaný externými modulmi, ktoré dodajú morfologické a syntaktické informácie o reťazci. Cieľovým jazykom je čeština.Classification of syntactically meaningful sentences is a very useful task for the applications of natural language processing, for example machine translation, search engines and question answering systems. The theoretical linguistic research considers the language to be a system of layers. In our project, a term 'to-be-meaningful' will be specified with respect to this point of view. Namely, the morphological and syntactic layers will be considered. A knowledge-based algorithm classifying a string of Czech words being either meaningful or meaningless will be proposed and implemented. Before being classified, strings will be pre-processed by the external modules. Czech will be used as the object language.
Institution: Charles University Faculties (theses)
(web)
Document availability information: Available in the Charles University Digital Repository. Original record: http://hdl.handle.net/20.500.11956/26751