Název:
Frekvenční distribuce nominální flexe v češtině
Překlad názvu:
Frequency distribution of nominal inflection in Czech
Autoři:
Janda, Vojtěch ; Křivan, Jan (vedoucí práce) ; Lukeš, David (oponent) Typ dokumentu: Bakalářské práce
Rok:
2017
Jazyk:
cze
Abstrakt: [cze][eng] Tato práce využívající metod lingvistických přístupů na základě užívání ověřuje, zda lze vysvětlit rozdílnou frekvenční distribuci pádů u jednotlivých substantiv v češtině pomocí hierarchie životnosti. Z vyváženého korpusu současných psaných textů SYN2015 extrahuji gramatické profily substantiv, skládající se z informací o rodu a čísle; na těchto profilech provádím klastrovou analýzu, jež dělí gramatické profily do skupin substantiv s podobnou relativní frekvenční distribucí pádů. Na základě klastrové analýzy a modelování podmíněných inferenčních stromů potvrzuji, že životnost rozděluje sledovaný vzorek na dvě skupiny. Klíčová slova: hierarchie životnosti, klastrová analýza, korpusová metoda, usage-base linguisticsEmploying methods of usage-based linguistic approaches, this paper tests the claim that differerences in frequential distributions of cases of nominals in Czech can be explained with the animacy hierarchy. Grammatical profiles consisting of information about gender and number are extracted from SYN2015, a balanced corpus of contemporary written texts, and analysed by hierarchical clustering which groups the grammatical profiles according to similarities of relative frequential distribution of cases. The cluster analysis and subsequential conditional inference tree modelling that animacy divides the sample into two groups. Key words: frequency analysis, animacy hierarchy, cluster analysis, corpus method
Klíčová slova:
hierarchie životnosti|korpusová metoda|statistické klastrování|usage-based linguistics; animacy hierarchy|corpus method|statistical clustering|usage-based linguistics