Název:
Implementace metod analýzy struktury českých souvětí.
Překlad názvu:
An Implementation of Methods of Structural Analysis of Czech Complex Sentences
Autoři:
Dutkevič, Jiří ; Kuboň, Vladislav (vedoucí práce) ; Holan, Tomáš (oponent) Typ dokumentu: Bakalářské práce
Rok:
2012
Jazyk:
cze
Abstrakt: [cze][eng] Název práce: Implementace metod analýzy struktury českých souvětí. Autor: Jiří Dutkevič Katedra / Ústav: Ústav formální a aplikované lingvistiky Vedoucí bakalářské práce: doc. RNDr. Vladislav Kuboň, Ph.D., Ústav formální a aplikované lingvistiky Abstrakt: Práce se zabývá automatickou analýzou struktur souvětí v češtině. Shrnuje výsledky předchozího výzkumu, užívá v něm navržené metody rozdělení souvětí do segmentů pomocí přesně definované množiny separátorů a na základě přednesených pravidel navrhuje tři metody automatického určování úrovní jednotlivých segmentů v souvětí a tím i jejich vzájemných vztahů. Jedna metoda přímo využívá pravidel navržených v odkazovaném výzkumu, druhá používá genetický algoritmus a třetí neuronovou síť. Práce obsahuje implementaci těchto metod a vyhodnocení výsledků na ručně anotovaných datech z Pražského závislostního korpusu.Title: An Implementation of Methods of Structural Analysis of Czech Complex Sentences Author: Jiří Dutkevič Department: Institute of Formal and Applied Linguistics Supervisor: doc. RNDr. Vladislav Kuboň, Ph.D., Institute of Formal and Applied Linguistics Abstract: This paper discusses automated analysis of complex sentences in Czech language. It summarizes the results of preceding research, uses therein described method for splitting complex sentences into segments using well defined set of separators and proposes three methods of automated assignment of levels to segments (which also describe relations between the segments) in sentences based on rules presented in the research. First method directly applies the rules presented in referenced research papers, the second method uses a genetic algorithm and the third makes use of a neural network. This paper includes an implementation of these methods and an analysis of the results using manually annotated data from the Prague Dependency Treebank.
Klíčová slova:
genetické algoritmy; neuronové sítě; počítačová lingvistika; struktura souvětí; syntaxe; complex sentence structure; computational linguistics; genetic algorithms; neural networks; syntax