Original title:
Segmentační analýza českých vět
Translated title:
Segmentation analysis of Czech sentences
Authors:
Procházka, Jan ; Kuboň, Vladislav (advisor) ; Holan, Tomáš (referee) Document type: Bachelor's theses
Year:
2008
Language:
cze Abstract:
[cze][eng] Cílem této práce je implementace segmentační analýzy českého jazyka včetně vytvoření seznamu separátorů. Kromě toho je zde navržena a implementována metoda rozdělení do klauzí. Implementace využívá český morfologický analyzátor prof. Hajiče. Samotný program je napsán v Pythonu. Metoda byla odladěna na korpusu 62 vět a otestována na korpusu velikosti 80 vět.Objective of this work is implementing of segmentation analysis method for Czech language including creating list of separators. Also method, how to divide long sentences into clauses, is proposed and implemented. Implementation uses Czech "Free" Morfology by Jan Hajič. Program is written in Python. Method was debugged on 62-sentences and tested on 80-sentences corpus.
Institution: Charles University Faculties (theses)
(web)
Document availability information: Available in the Charles University Digital Repository. Original record: http://hdl.handle.net/20.500.11956/15893