Národní úložiště šedé literatury Nalezeno 35 záznamů.  1 - 10dalšíkonec  přejít na záznam: Hledání trvalo 0.01 vteřin. 
Analytické predikáty s kategoriálním slovesem a jejich využití pro morfologickou anotaci
Vyskočilová, Karolína ; Petkevič, Vladimír (vedoucí práce) ; Radimský, Jan (oponent) ; Kettnerová, Václava (oponent)
iii Abstrakt Disertační práce se zaměřuje na analytický predikát s kategoriálním slovesem (dále APKS), tedy spojení jako provádět kontrolu nebo chovat úctu. Ilustruje, jak zúročit teoretické poznání těchto spojení v praxi, vytěžit ho při morfologické disambiguaci, a tím potenciálně ovlivnit i syntaktickou analýzu. Teoretická část práce pokrývá tři oblasti - APKS, značkování korpusů a pravidlový disambiguační systém LanGr. APKS charakterizuje včetně kritérií pro jejich určování, popisuje současný stav jejich poznání a usouvztažňuje příspěvky k tématu, které vyšly v průběhu posledních patnácti let; důraz je přitom kladen zejména na syntaktický pohled na tyto konstrukce. Zároveň práce mapuje existující soupisy těchto spojení. Následuje popis procesu značkování psaných korpusů Českého národního korpusu, s nímž úzce souvisí i systém automatické morfologické disambiguace LanGr, kterému je věnována pozornost jak na teoretické úrovni tvorby pravidel, tak na úrovni jejich zápisu ve stejnojmenném programovacím jazyce. Praktická část práce se zaměřuje na konkrétní výsek morfologické homonymie akuzativních tvarů a zlepšuje morfologickou anotaci na základě nově vytvořených pravidel pro systém LanGr. Nejprve v první případové studii na datech z korpusu SYNv10 identifikuje pravidelnosti APKS s bezpředložkovým akuzativem,...
Words that matter. Towards a Swedish-Czech colligational lexicon of basic verbs
Cinková, Silvie ; Petkevič, Vladimír (vedoucí práce) ; Malmgren, Sven-Göran (oponent) ; Panevová, Jarmila (oponent)
Základní slovesa (basic verbs), tj. frekventovaná významová slovesa, jež zpravidla popisují fyzický pohyb, umístění, stav, nebo děj, procházejí řadou sémantických posunů, díky kterým se používají k vyjádření druhotných, přenesených významů. V krajních případech se dané sloveso stává pomocným, způsobovým, nebo fázovým slovesem a přestávají pro ně platit kolokační omezení, jež se vztahují na sloveso užité v jeho primárním (tj. doslovném) významu. Tato užití sloves bývají většinou dobře dokumentována v gramatikách i učebnicích, stejně jako kvalitní slovníky podávají podrobnou informaci o užití těchto sloves v ustálených frazeologických spojeních. Mezi plně gramatikalizovaným užitím na jedné straně a idiomatickým, frazeologickým užitím na druhé straně však existuje celá škála užití základních sloves v přenesených významech, jejíž zvládnutí je pro nerodilého mluvčího značně obtížné: užití v přeneseném významu, jež mají omezenou kolokabilitu. To jsou především verbonominální konstrukce někdy nazývané analytické predikáty (light verb constructions), ale také užití, která za určitých omezených morfosyntaktických podmínek (např. pouze v negaci) aktivují abstraktní sémantické rysy u jiných predikátů, např. zesilují význam, nebo implikují, že daný děj již trvá dlouho, a podobně. Tato druhotná užití významových sloves...
Kvantitativní pohled na strukturu arabského textu
Milička, Jiří ; Zemánek, Petr (vedoucí práce) ; Petkevič, Vladimír (oponent)
Tato studie navrhuje několik obecných kvantitativně lingvistických falzifikovatelných hyptotéz, které následně ověřuje na textech v moderní spisovné arabštině, klasické arabštině a několika evropských jazycích, přičemž arabština a čeština slouží také jako zdroj inspirace. Hypotézy se týkají struktur, které vytvářejí frekvence a délky slov ve větách a v nadvětných celcích, dále souvislostí vztahu délek vět a frekvencí slov v nich obsažených s Menzerathovým- Altmannovým zákonem a pohledu na text pomocí tzv. kombinatorického zobrazení.
Machine Translation of Related Asian Languages
Larasati, Septina Dian ; Kuboň, Vladislav (vedoucí práce) ; Petkevič, Vladimír (oponent)
This thesis presents the development of an MT system between Indonesian and Malaysian. The system uses a method of almost a direct translation exploiting the similarity of both languages. This method was previously used on a number of language pairs of European languages. The thesis also elaborates the attempts to make language resources from scratch since the languages are under-resourced.
On the Linguistic Structure of Emotional Meaning in Czech
Veselovská, Kateřina ; Hajičová, Eva (vedoucí práce) ; Petkevič, Vladimír (oponent) ; Smrž, Pavel (oponent)
Název práce: K lingvistické struktuře emocionálního významu v češtině Autor: Mgr. Kateřina Veselovská Ústav: Ústav formální a aplikované lingvistiky Vedoucí disertační práce: Prof. PhDr. Eva Hajičová, DrSc., Ústav formální a aplikované lingvistiky Klíčová slova: emocionální význam, lingvistická struktura, postojová analýza, opinion mining, evaluativní jazyk Abstrakt: Dizertační práce má dva hlavní cíle. Za prvé přináší analýzu jazykových prostředků, které společně formují emocionální význam psaných výpovědí v češtině. Za druhé využívá zjištění týkající se emocionálního jazyka v komputačních aplikacích. Podáváme systematický přehled lexikálních, morfosyntaktických, sémantic- kých a pragmatických aspektů emocionálního významu v českých výpovědích a navrhujeme formální reprezentaci emocionálních struktur v rámci Pražského závislostního korpusu a konstrukční gramatiky. V oblasti komputačních aplikací se zaměřujeme na témata postojové analýzy, tedy automatické extrakce emocí z textu. Popisujeme tvorbu ručně anotovaných emocionálních zdrojů dat a řešíme dvě základní úlohy postojové analýzy, klasi- fikaci polarity a identifikaci cíle hodnocení. V obou těchto úlohách dosahujeme uspokojivých výsledků.
Valenční rámce substantiv v češtině na základě korpusových dat
Čermáková, Anna ; Petkevič, Vladimír (vedoucí práce) ; Panevová, Jarmila (oponent) ; Kopřivová, Marie (oponent)
Cílem práce je vytvo ení lexikologického rámce pro systematický popis valence eských substantiv na základ analýzy dat z eského národního korpusu (SYN2000). Valence je zde chápána jako systémová lexikologická vlastnost slov. Valence je abstraktním vztahem, který má konkrétní realizace, v této práci se pro zjednodušení pojem valence používá pro obojí. Pro ú ely analýzy je valence pojímána pom rn voln , protože není vhodné dop edu p edpokládat, že tu jsou všechny její aspekty jasné. P edpokládá se jako platná napravo od substantiva a analýza si všímá jev , které se zde systematicky (z hlediska frekvence výskytu) vyskytují. Práce nabízí korpusem ízený lingvistický popis, který se zam uje na slova v kontextu, ve kterém se obvykle nacházejí a vytvá ejí tak typické slovní vzorce. Základ analýzy tvo í náhodné vzorky 99 náhodn vybraných substantiv ze st edního frekven ního pásma. V p ípadech, kdy vzorky neposkytly dostate né množství dat, byla analýza rozší ena o hledání pomocí specializovaných dotaz do korpusu. U substantiv z vysokých frekven ních pásem p edpokládáme rozt íšt n jší valen ní profily, pro potvrzení této hypotézy bylo n kolik substantiv z vysokých frekven ních pásem podrobeno dodate né stru né analýze.
Forma a funkce u substantiv v češtině: vztah pádu a syntaktické funkce. Na materiálu korpusu současné psané češtiny (SYN2005)
Jelínek, Tomáš ; Petkevič, Vladimír (vedoucí práce) ; Lopatková, Markéta (oponent) ; Uličný, Oldřich (oponent)
Pád je v češtině základním prostředkem morfologické roviny, jímž substantiva vyjadřují svou funkci ve větě. Cílem této práce je popsat z frekvenčního hlediska vztah mezi formou a funkcí substantiv, přesněji řečeno, jak často se prosté a předložkové pády substantiv používají k realizaci syntaktických funkcí ve větě. Práce je založena na rozsáhlém korpusu synchronní psané češtiny SYN2005. Abychom získali údaje o frekvencích syntaktických funkcí substantiv ve vztahu k jejich pádům, opatřili jsme korpus SYN2005 závislostním syntaktickým značkováním, jehož formát jsme převzali z analytické roviny Pražského závislostního korpusu. Syntaktickou anotaci jsme uskutečnili pomocí stochastického MST parseru. Spolehlivost syntaktické anotace však nebyla dostatečně vysoká, vytvořili jsme proto automatický opravný modul, který vyhledává chyby syntaktické anotace ve výstupu stochastického parseru a na základě lingvistických pravidel tyto chyby opravuje. Implementovali jsme 26 různých pravidel, počet chyb anotace se však podařilo snížit jen o 6-8 %. Opravný modul je však možné dále rozvíjet. Lze jím korigovat výstup kteréhokoli závislostního parseru natrénovaného na datech Pražského závislostního korpusu. Syntakticky anotovaný korpus SYN2005 jsme využili jako základ výzkumu frekvence syntaktických funkcí substantiv...
Evaluace chybové anotace v žákovském korpusu češtiny
Štindlová, Barbora ; Šebesta, Karel (vedoucí práce) ; Petkevič, Vladimír (oponent) ; Šindelářová, Jaromíra (oponent)
Název práce: Evaluace chybové anotace v žákovském korpusu češtiny Autor: Barbora Štindlová Ústav: Ústav českého jazyka a teorie komunikace, Filozofická fakulta, Univerzita Karlova Vedoucí disertační práce: prof. PhDr. Karel Šebesta, CSc. Abstrakt: Předkládaná práce se obecně týká tématu češtiny jako cizího jazyka a částečně zasahuje do oblasti korpusové lingvistiky, neboť se věnuje problematice žákovských korpusů, především pak otázkám jejich chybového značkování a možnostem evaluace anotačních schémat. Ţákovské korpusy se staly významným zdrojem pro poznání žákovského mezijazyka a významným stimulem pro různé oblasti studia a výuky cizího, resp. druhého jazyka. Jsou využívány zejména pro kontrastivní srovnávání jazyka rodilých a nerodilých mluvčích, resp. srovnávání žákovských mezijazyků a pro tzv. počítačem podporovanou chybovou analýzu žákovského jazyka. Pro tento typ analýzy má zcela zásadní důležitost tzv. chybové značkování. Chybové značkování je u každého korpusu, pokud jej používá, založeno na chybové typologii, jejíž vymezení je v mnoha teoretických aspektech problematické. Z toho důvodu je důležitým krokem při výstavbě žákovského korpusu zhodnocení spolehlivosti a validity navrženého anotačního schématu. Disertační práce se zaměřuje především na technické aspekty a specifické problémy při...

Národní úložiště šedé literatury : Nalezeno 35 záznamů.   1 - 10dalšíkonec  přejít na záznam:
Chcete být upozorněni, pokud se objeví nové záznamy odpovídající tomuto dotazu?
Přihlásit se k odběru RSS.