Název:
Rozdělení délky vět
Překlad názvu:
Sentence length distribution
Autoři:
Kašpar, Martin ; Hlávka, Zdeněk (vedoucí práce) ; Hlubinka, Daniel (oponent) Typ dokumentu: Bakalářské práce
Rok:
2011
Jazyk:
cze
Abstrakt: [cze][eng] V předložené práci studujeme, jestli lze popsat délky vět prozaického textu pomocí některého z pravděpodobnostních rozdělení. Konkrétně se zaměříme na negativně binomické, logaritmicko normální a Sichelovo rozdělení a jejich srovnání. Zvláštní pozornost věnujeme Sichelovu rozdělení, které bylo vytvořeno za účelem popisu bibliometrických dat. Dále v práci podrobně zkoumáme odhady parametrů všech tří rozdělení a následně teoretické výsledky použijeme na konkrétní data (několik textů v češtině a v angličtině). Nakonec testujeme přesnost jednotlivých rozdělení a odhadů parametrů na základě výsledků popsaných v této práci. 1In the present work we study whether it is possible to describe the lengths of sentences of a prosaic text by a probability distribution. We focus on negative binomial, lognormal and Sichel distributions and their comparison. We study Sichel distribution in detail, because it was introduced as distribution for description of bibliometric data. We also investigate estimation of parameters of all three distributions and then use the theoretical results on specific data (a few texts in Czech and English). Finally, we test the accuracy of the distributions and estimated parameters, using the results given in this work. 1
Klíčová slova:
Délky vět; GIGP rozdělení; Sichelovo rozdělení; GIGP distribution; Sentence length; Sichel distribution