|
Kvantitativní charakteristiky termínů
Kováříková, Dominika ; Čermák, František (vedoucí práce) ; Bozděchová, Ivana (oponent) ; Machová, Svatava (oponent)
Metoda automatického vyhledávání termínů TERMIT je zaměřena nejen na samotnou úspěšnost, tedy co nejvyšší počet správně vyhledaných termínů, ale v první řadě na vlast- nosti, které při identifikaci jednoslovných a víceslovných termínů hrají nejdůležitější roli. Je založena na data miningu, tedy na vytěžování informací z velkých objemů (korpusových) dat. Metoda TERMIT se při rozpoznávání termínů v reálných textech i při hledání pod- statných kvantitativních rysů termínů osvědčila. Na jejím základě je možné jednoslovný termín charakterizovat jako slovo, které se v odborných textech daného oboru vyskytuje výrazně častěji než v textech neakademických, vyskytuje se jen v malém počtu akade- mických disciplín, v celém korpusu (SYN2010) je nerovnoměrně rozložené a málo frekven- tované a rozestupy mezi jeho jednotlivými výskyty jsou nepravidelné. Víceslovný termín je podle výsledků metody TERMIT ustálená kolokace složená z méně frekventovaných slov, která obvykle obsahuje alespoň jedno slovo s vysokou terminologickou platností, tedy jed- noslovný termín. S pomocí těchto charakteristik termínů lze více než 95 % textu zařadit správně mezi jednoslovné i víceslovné termíny a netermíny. Na...
|
| |
|
Diachronní srovnání synchronních korpusů
Křen, Michal ; Čermák, František (vedoucí práce) ; Kučera, Karel (oponent) ; Králík, Jan (oponent)
Práce představuje metodu pro diachronní srovnání synchronních korpusů zachycu- jících blízké stavy jazyka. Cílem práce je především zhodnotit možnosti a meze de- tekce vývojových tendencí v jazyce na materiálu synchronních psaných korpusů řady SYN. Metodologicky jde o corpus-driven přístup založený na statistickém vyhodno- cení rozdílů mezi normalizovanými průměrnými redukovanými frekvencemi lemmat a lexikálních kombinací. Metoda je aplikována v několika variantách na různě definované subkorpusy korpusu SYN a podrobně vyhodnocena. Provedené srovnání ztěžuje především vliv složení jednotlivých korpusů a provázanost změn v jazyce se změnami společenskými. Protože neumíme spolehlivě odlišit zárodky diachronních posunů od přirozeně existující synchronní variability, je statisticky zjištěná významnost frekvenčních rozdílů jednotlivých výrazů zpětně ověřována na korpusech a interpretace výsledků korigována znalostí jejich přesného složení. Závěry jsou založeny především na publicistice, která je z psaného jazyka nejvíce otevřená změnám. Změny v jazyce publicistiky lze charakterizovat jako tematický od- klon od původní politické a ekonomické orientace směrem k tématům týkajícím se praktického života a využívání volného času spojený se zvyšující se neformálností, která způsobuje posuny ve frekvencích...
|
| |
|
Srovnání českých a finských verbálních časů v paralelním korpusu
Noronkoski, Sanni ; Čermák, František (vedoucí práce) ; Fárová, Lenka (oponent)
Cílem této práce je srovnávat metodami korpusové lingvistiky systémy slovesných časů v češtině a ve finštině, zejména z hlediska překladu. Tato otázka mě zajímá především z pohledu překladatele, tedy praktického, ale abychom mohli vytvářet nějaké obecné zákonitosti této problematiky, budeme samozřejmě muset vycházet z teorie. Proto je třeba udělat obecný srovnávací obraz vzájemného vztahu slovesných systémů těchto dvou jazyků. Ten pak bude porovnán s výsledky získanými pomocí korpusu. V analytické části této práce se zaměříme na 20 vybraných českých sloves, jejich výskyty v česko-finském paralelním korpusu (projekt InterCorp), jejich finské ekvivalenty, jazykové okolnosti a kontexty těchto sloves. Předmětem zkoumání jsou hlavní tendence v překládání slovesných časů z jednoho jazyka do druhého, zejména v případech, kdy se slovesné časy používané v těchto jazycích ve značné míře liší. Tyto rozdíly se pokusím představit a vysvětlit na základě gramatiky. Zajímavá je také otázka, do jaké míry je na základě paralelního korpusu možno vytvářet obecné zákonitosti.
|
|
Novější vývoj českého lexikonu, zvl. v oblasti ekonomické terminologie
Nowak, Filip ; Čermák, František (vedoucí práce) ; Holub, Jan (oponent)
Ekonomie patří k nejpopulárnějším vědním oborům dneška. Už dlouho se jí nezabývají pouze experti, ale i ekonomové-amatéři. Ekonomika ovlivňuje náš každodenní život a my máme vliv na její vývoj, ale i jazyk, kterým je popisována. Tato situace způsobuje výskyt různých anomálií mezi termíny, snahu používat neobvyklých jazykových prostředků, ať už z důvodu zaujetí čtenáře nebo přirozené motivace známými mimooborovými skutečnostmi. Tato práce se snaží poukázat na některé z těchto jevů. Výzkum bazíruje na odborných ekonomických textech získaných z elektronické databáze Českého národního korpusu, který dále umožňuje i kvantitativní klasifikaci výsledků. Pozornost je zde věnována především pro češtinu nejfrekventovanějšímu modelu dvouslovných termínů adjektivum - substantivum, substantivum - adjektivum, kde kromě sémantické, funkční a kvantitativní charakteristiky jsou vymezeny i metaforické a metonymické motivace termínů či jejich pragmatické rysy. Je zde i snaha sémanticky roztřídit i samotné metafory a metonymie v kolokacích, které se v náhodně zvolených vzorcích textu vyskytly. Pochopitelně je zde nastíněna i samotná problematika termínů a metafor. Jednotlivé kvantitativní výsledky jsou umístěny v tabulkách každé z kapitol, v zadní části je pak k nalezení příloha obsahující samotné termíny i všechny nalezené...
|
|
Generalizace a specifikace lexikálního významu v soudobém uměleckém překladu
Kubáčková, Jana ; Čermák, František (oponent) ; Jettmarová, Zuzana (vedoucí práce)
Práce se zaměřuje na generalizaci a specifikaci v překladu jako obecné tendence a případné kandidáty na status překladové univerzálie. Podrobně se věnuje metodám jejich empirického výzkumu. Teoretická část práce nejprve v kapitolách 1 a 2 pojednává o generalizaci a specifikaci v kontextu deskriptivní translatologie, korpusové translatologie a v souvislosti s teoretickými pracemi Jiřího Levého. Kapitola 2 dále doplňuje výklad obou univerzálií pojednáním o lexikálním významu a rozebírá pojetí synonymie v lexikologii a stylistice. Upozorňuje také na typologické rozdíly mezi angličtinou a češtinou. Zabývá se dopadem těchto rozdílů na zobecňující či specifikující posuny v lexikálním významu a na elektronické zpracování dat pomocí korpusových manažerů. Kapitola 3 popisuje materiál a metody následujícího empirického výzkumu. Věnuje se postupně jeho třem etapám - srovnatelnému jednojazyčnému korpusu, paralelnímu anglicko-českému korpusu složenému z pěti textů a paralelnímu korpusu originálu a dvou překladů. Zmiňuje se o výběru textů, o referenčních korpusech a o použitých softwarových nástrojích. Většina textů v korpusech se řadí k "hlavnímu proudu" prozaické beletrie. Obsahem 4. kapitoly jsou tři etapy empirického výzkumu. První etapa se zaměřuje na analýzu tří velkých srovnatelných subkorpusů, které dohromady...
|
|
Aspekty slovanského "mít" - v gramatice. Jeho auxiliace a gramatikalizace v lionstrulicích typu evropského analytického perfekta "mít" + PPP - bulharština, makedonština a korpusová studie češtiny
Marvanová, Mira ; Čermák, František (vedoucí práce) ; Damborský, Jiří (oponent) ; Petkevič, Jiří (oponent)
Sloveso "mít" patří k významným prvkům ELA (Evropského lingvistického areálu) a může být považováno za jeden z prvofázových evropeismů, nicméně však nepatří do indoevropského dědictví a jeho vznik je odlišný ve většině ideo prajazyků. Za pozdnější evropeismus strukturní dimenze lze považovat i vznik a vývoj evropských perfektních habere-časů nebo konstrukcí tohoto typu ve většině tzv. habere-jazyků, slovanské nevyjímaje. Jde zřejmě o postupující proces s původním epicentrem v lidové (vulgární) latině - a to s jistou účastí řečtiny - v dlouholetých podmínkách vzájemného bilingvismu. Následné procesy difúze či indukce formují mezi evropskými habere-j azyky několik zón, z nichž do posledních dvou patří rovněž současné slovanské habere-j azyky. Na jihu se tento proces stal součástí balkánské jazykové integrace. Nejintenzivněji proběhl v tomto areálu zřejmě v těch makedonských a jihobulharských dialektech, které byly v přímém kontaktu s neslovanskými jazyky aktivně disponujícími habere-perfektem. Makedonština, která svůj standard teprve tvořila, byla pro inovace velmi přístupná a dosáhla tak během období pouhých několika generací gramatického statusu dané konstrukce, srovnatelného se statusem evropských perfekt okcidentálního typu, kde se tento fenomén vyvíjel po řadu staletí. Také standardní bulharština a...
|
| |
| |