Original title:
Nalezení slovních kořenů v češtině
Translated title:
Stemming of Czech Words
Authors:
Hellebrand, David ; Bartík, Vladimír (referee) ; Chmelař, Petr (advisor) Document type: Master’s theses
Year:
2010
Language:
cze Publisher:
Vysoké učení technické v Brně. Fakulta informačních technologií Abstract:
[cze][eng]
Cílem této diplomové práce je vytvořit pro český jazyk lemmatizační algoritmus založený na gramatických pravidlech. Práce obsahuje popis problematiky lemmatizace a několika různých lemmatizačních algoritmů. Dále jsou popsány základy gramatiky českého jazyka a také jazyka Snowball, ve kterém budou navržené postupy implementovány. Hlavní část tvoří popis implementace lemmatizačního algoritmu.
The goal of this master's thesis is to develop stemming algorithm for czech language based on grammatical rules. You can find a description of stemming process and a comparsion of stemming algorithms in this project. The basics of czech grammar and Snowball language are also described here. The main part of this thesis concerns the implementation of the new czech stemming algorithm.
Keywords:
czech language; grammatical rules.; Snowball; stemmer; Stemming; stemming algorithms; gramatická pravidla.; Lemmatizace; lemmatizační algoritmy; lemmatizátor; Snowball; český jazyk
Institution: Brno University of Technology
(web)
Document availability information: Fulltext is available in the Brno University of Technology Digital Library. Original record: http://hdl.handle.net/11012/54293