Original title:
Frekvenční distribuce nominální flexe v češtině
Translated title:
Frequency distribution of nominal inflection in Czech
Authors:
Janda, Vojtěch ; Křivan, Jan (advisor) ; Lukeš, David (referee) Document type: Bachelor's theses
Year:
2017
Language:
cze Abstract:
[cze][eng] Tato práce využívající metod lingvistických přístupů na základě užívání ověřuje, zda lze vysvětlit rozdílnou frekvenční distribuci pádů u jednotlivých substantiv v češtině pomocí hierarchie životnosti. Z vyváženého korpusu současných psaných textů SYN2015 extrahuji gramatické profily substantiv, skládající se z informací o rodu a čísle; na těchto profilech provádím klastrovou analýzu, jež dělí gramatické profily do skupin substantiv s podobnou relativní frekvenční distribucí pádů. Na základě klastrové analýzy a modelování podmíněných inferenčních stromů potvrzuji, že životnost rozděluje sledovaný vzorek na dvě skupiny. Klíčová slova: hierarchie životnosti, klastrová analýza, korpusová metoda, usage-base linguisticsEmploying methods of usage-based linguistic approaches, this paper tests the claim that differerences in frequential distributions of cases of nominals in Czech can be explained with the animacy hierarchy. Grammatical profiles consisting of information about gender and number are extracted from SYN2015, a balanced corpus of contemporary written texts, and analysed by hierarchical clustering which groups the grammatical profiles according to similarities of relative frequential distribution of cases. The cluster analysis and subsequential conditional inference tree modelling that animacy divides the sample into two groups. Key words: frequency analysis, animacy hierarchy, cluster analysis, corpus method
Keywords:
animacy hierarchy|corpus method|statistical clustering|usage-based linguistics; hierarchie životnosti|korpusová metoda|statistické klastrování|usage-based linguistics
Institution: Charles University Faculties (theses)
(web)
Document availability information: Available in the Charles University Digital Repository. Original record: http://hdl.handle.net/20.500.11956/93056