Original title:
Valenční rámce substantiv v češtině na základě korpusových dat
Translated title:
Valency frames of Czech nouns: corpus-driven study
Authors:
Čermáková, Anna ; Petkevič, Vladimír (advisor) ; Panevová, Jarmila (referee) ; Kopřivová, Marie (referee) Document type: Doctoral theses
Year:
2008
Language:
cze Abstract:
[cze][eng] Cílem práce je vytvo ení lexikologického rámce pro systematický popis valence eských substantiv na základ analýzy dat z eského národního korpusu (SYN2000). Valence je zde chápána jako systémová lexikologická vlastnost slov. Valence je abstraktním vztahem, který má konkrétní realizace, v této práci se pro zjednodušení pojem valence používá pro obojí. Pro ú ely analýzy je valence pojímána pom rn voln , protože není vhodné dop edu p edpokládat, že tu jsou všechny její aspekty jasné. P edpokládá se jako platná napravo od substantiva a analýza si všímá jev , které se zde systematicky (z hlediska frekvence výskytu) vyskytují. Práce nabízí korpusem ízený lingvistický popis, který se zam uje na slova v kontextu, ve kterém se obvykle nacházejí a vytvá ejí tak typické slovní vzorce. Základ analýzy tvo í náhodné vzorky 99 náhodn vybraných substantiv ze st edního frekven ního pásma. V p ípadech, kdy vzorky neposkytly dostate né množství dat, byla analýza rozší ena o hledání pomocí specializovaných dotaz do korpusu. U substantiv z vysokých frekven ních pásem p edpokládáme rozt íšt n jší valen ní profily, pro potvrzení této hypotézy bylo n kolik substantiv z vysokých frekven ních pásem podrobeno dodate né stru né analýze.This thesis aims at providing a lexicological framework for systematic description of valency of Czech nouns. Valency is seen here as a lexicological property of words. Valency is an abstract relation with concrete textual realizations and the term "valency" is used here for both: the abstract notion and the concrete valency exponents and realisations. The analysis is corpus-driven and as such it is based on a rather loose notion of valency, devoid of any pre-conceived ideas, concentrating on typical structural patterns of occurrence on the right side of the noun under investigation. For the analysis the corpus SYN2000, a part of the Czech National Corpus has been used. The analysis is based on random selections of concordance lines of randomly chosen 99 nouns from the middle frequency range. In some cases, where the data proved insufficient, we have carried out additional specialized corpus queries. For high frequency nouns we assume highly differentiated valency profiles; to confirm this hypothesis we have carried out additional brief analysis of several high frequency nouns. The most frequent valency of Czech nouns is genitive complementation, which we find as occurring with more than 90% of the analysed nouns. For some of the nouns, the genitive valency is a very dominant valency pattern (in some cases...
Institution: Charles University Faculties (theses)
(web)
Document availability information: Available in the Charles University Digital Repository. Original record: http://hdl.handle.net/20.500.11956/15176