Original title:
Automatické zařazování neznámých slov na základě derivačních vazeb
Translated title:
Automatic Categorization of Unknown Words Based on Derivational Relations
Authors:
Faltusová, Marie ; Dytrych, Jaroslav (referee) ; Smrž, Pavel (advisor) Document type: Master’s theses
Year:
2020
Language:
cze Publisher:
Vysoké učení technické v Brně. Fakulta informačních technologií Abstract:
[cze][eng]
Tato diplomová práce se zabývá vytvořením systému pro automatické zařazování neznámých slov na základě derivačních vazeb. Pro tento účel byl systém navržen tak, aby z~elektronických slovníkových dat získával derivační vazby a jejich rozborem z nich vytvářel slovotvorné modely. Na základě těchto znalostí je poté možné začleňovat nezařazená slova do stávajících hnízd, utvořených ze získaných vazeb, a jejich modelů, případně vytvářet nové. Čtenář bude postupně seznámen s důvody, které vedou k neustálé proměně či rozšiřování slovní zásoby, budou vysvětleny způsoby, jakými se odvozují slova v českém jazyce, a jak lze získat informace o změnách slov, vzniklých během derivačního procesu. Tento systém navazuje a rozšiřuje výzkum oblasti derivační morfologie v projektu morfologický analyzátor Výzkumné skupiny znalostních technologií, působící na Fakultě informačních technologií Vysokého učení technického v Brně.
This master thesis deals with the construction of a system for automatic classification of~unknown words based on derivation bonds. For this purpose, the system was designed to~extract derivative links based on electronic dictionaries and to create word-forming models from them. Based on this knowledge, it is then possible to incorporate unclassified words into existing nests formed from the obtained bonds, and their models, or create new ones. The reader will be gradually acquainted with the reasons that lead to the continuous transformation or expansion of the lexicon, the ways in which the words in~the~Czech language are derived and how to obtain information about the changes caused by this derivation process. This system builds on and extends the research of the branch of morphology in~the~project of a morphological analyzer of the Research Group of Knowledge Technologies, working at the Faculty of Information Technology of the Brno University of~Technology.
Keywords:
czech language; derivation; derivative bonds; derivative morphology; formants; linguistics; nesting; word formation; word-formation base; word-formation model; derivace; derivační morfologie; derivační vazby; formanty; hnízdění; lingvistika; slovotvorba; slovotvorná báze; slovotvorný model; český jazyk
Institution: Brno University of Technology
(web)
Document availability information: Fulltext is available in the Brno University of Technology Digital Library. Original record: http://hdl.handle.net/11012/192459