Název:
Derivační morfologie češtiny na základě rozsáhlých korpusových dat
Překlad názvu:
Derivational Morphology of Czech on Large Corpus Data
Autoři:
Faltusová, Marie ; Dytrych, Jaroslav (oponent) ; Smrž, Pavel (vedoucí práce) Typ dokumentu: Bakalářské práce
Rok:
2017
Jazyk:
cze
Nakladatel: Vysoké učení technické v Brně. Fakulta informačních technologií
Abstrakt: [cze][eng]
Tématem této práce je zkoumání slovotvorby v českém jazyce. Hlavním cílem je vytvořit modul získávající derivace z dat elektronického Slovníku spisovné češtiny. Tato problematika byla vyřešena sestrojením tříúrovňového zpracování vycházejícího z dat slovníku. První úrovní je získání derivací z definic lemmat, druhým krokem je seskupení základních tvarů podle jejich podobností a třetí fází je ohodnocení získaných derivačních dvojic značkou derivační třídy, do které spadají. Zpracováním se podařilo získat více než 4 500 nových slov a ohodnotit nad 20 000 derivačních vazeb. Modul se stal plnohodnotnou součástí Morfologického analyzátoru Výzkumné skupiny znalostních technologií, působící na Fakultě informačních technologií Vysokého učení technického v Brně.
Subject of this thesis is study of word formation in the Czech language. The main aim is to create a module acquiring derivations from data of the electronic Dictionary of the Czech Language. This problematics has been solved by constructing three-level processing based on dictionary data. The first level is to obtain derivations from lemma definitions, the second step is making groups of basic forms according to their similarities, and the third stage is the evaluation of derivation pairs by number tag of derivation class to which they belong. I have managed to get more than 4 500 new words and evaluate over 20 000 derivative couples. The module has become a full-fledged part of the Morphological Analyzer of the Knowledge Technology Research Group, working at the Faculty of Information Technology of the Brno University of Technology.
Klíčová slova:
derivace; derivační třídy; morfologie; morfém; psycholingvistika; Slovník spisovné češtiny; slovotvorba; sociolingvistika; sufixace; vnitřní lingvistika; vnější lingvistika; zahnízďování; český jazyk; czech language; derivation; derivative classes; Dictionary of Czech; external linguistics; internal linguistics; morpheme; morphology; nesting; psycholinguistics; sociolinguistics; suffixation; word-formation
Instituce: Vysoké učení technické v Brně
(web)
Informace o dostupnosti dokumentu:
Plný text je dostupný v Digitální knihovně VUT. Původní záznam: http://hdl.handle.net/11012/69664