Název:
Segmentační analýza českých vět
Překlad názvu:
Segmentation analysis of Czech sentences
Autoři:
Procházka, Jan ; Holan, Tomáš (oponent) ; Kuboň, Vladislav (vedoucí práce) Typ dokumentu: Bakalářské práce
Rok:
2008
Jazyk:
cze
Abstrakt: [cze][eng] Cílem této práce je implementace segmentační analýzy českého jazyka včetně vytvoření seznamu separátorů. Kromě toho je zde navržena a implementována metoda rozdělení do klauzí. Implementace využívá český morfologický analyzátor prof. Hajiče. Samotný program je napsán v Pythonu. Metoda byla odladěna na korpusu 62 vět a otestována na korpusu velikosti 80 vět.Objective of this work is implementing of segmentation analysis method for Czech language including creating list of separators. Also method, how to divide long sentences into clauses, is proposed and implemented. Implementation uses Czech "Free" Morfology by Jan Hajič. Program is written in Python. Method was debugged on 62-sentences and tested on 80-sentences corpus.