|
Text data mining as an viable method of Japanese studies
Štefková, Tereza ; Kanasugi, Petra (vedoucí práce) ; Rosen, Alexandr (oponent)
Tato práce se zaměřuje na problematiku potenciálního využití metod dolování z textu v oblasti japonských studií. První část práce shrnuje základní přístupy dolování z textu a jejich aplikace v praxi. Dále podáváme podrobný výklad problematiky předzpracování textu, u kterého se soustředíme na techniky používané v případě japonštiny a angličtiny. Hlavní část práce spočívá v aplikaci metod dolování z textu na tři konkrétní výzkumné otázky z oblasti japonských studií. V prvním tématu ukážeme na příkladu děl dvou vybraných japonských proletářských autorů, jak mohou techniky shlukování odhalit zajímavé tematické rysy literárních děl. V případě druhého výzkumného tématu využijeme analýzu sentimentu za účelem vyšetření míry negativního sentimentu, který se objevuje v japonských a zahraničních novinových článcích pojednávajících o návštěvách, které vykonávají japonští představitelé ve svatyni Jasukuni. Nakonec se zaměříme na metody automatického shrnutí dokumentů, které aplikujeme na japonské a anglické texty. Získané výsledky detailně diskutujeme, zvláště se zaměřujeme na vyhodnocení použitelnosti představovaných metod pro japonská studia.
|
|
Textová ekvivalence vybraných polských adjektiv: korpusová analýza
Holmanová, Vladimíra ; Zasina, Adrian Jan (vedoucí práce) ; Rosen, Alexandr (oponent)
Bakalářská práce se zabývá textovou ekvivalencí vybraných polských adjektiv (lichy, bezcenny, pozostały, konieczny a ostatni). Zvolená adjektiva jsou zároveň zrádnými slovy (tzv. falešnými přáteli - faux amis), která mají svůj podobně znějící protějšek v češtině. Práce je rozdělena na část teoretickou a praktickou. V teoretické části je značný prostor věnován pojmu ekvivalence a literatuře, která se jí zabývá. Dále je vymezen pojem falešných přátel, zejména v češtině a polštině. Další pasáž se zabývá korpusy, zaměřuje se i na výhody korpusu oproti slovníku. Cílem analytické části je zjistit aktuální stav českých překladových ekvivalentů, které nejsou ve slovníku vždy zachyceny. Proto je slovníková ekvivalence porovnávána s ekvivalencí textovou. Jako zdroj textů je využit subkorpus paralelního korpusu InterCorp v 14 obsahující polské originální texty a jejich české překlady. V závěru práce jsou shrnuty poznatky vycházející z provedené analýzy korpusového materiálu. Klíčová slova: korpusová lingvistika, paralalení korpus, InterCorp, textová ekvivalence, polština, čeština, translatologie
|
| |
|
Netgraph-A Tool for Searching in the Prague Dependency Treebank 2.0
Mírovský, Jiří ; Hajič, Jan (vedoucí práce) ; Rosen, Alexandr (oponent) ; Ondruška, Roman (oponent)
Tato práce se zabývá spojením tří existujících stran. Na straně jedné byl Pražský závislostní korpus 2.0, jeden z nejvyspělejších korpusů lingvistického světa. Na straně druhé existoval omezený, ale velmi intuitivní vyhledávací nástroj Netgraph 1.0. A na straně třetí byli uživatelé toužící po takovém jednoduchém nástroji, který by však byl dostatečně silný pro vyhledávání v Pražském závislostním korpusu. V této práci zkoumáme anotaci Pražského závislostního korpusu 2.0, obzvláště tektogramatické roviny, jež je zdaleka nejsložitější rovinou tohoto korpusu, a vytváříme seznam požadavků na dotazovací jazyk, který by umožnil vyhledávání a studium všech lingvistických jevů v korpusu anotovaných. Navrhujeme rozšíření dotazovacího jazyka existujícího vyhledávacího nástroje Netgraphu 1.0 a ukazujeme, že tento rozšířený dotazovací jazyk vyhovuje formulovanému seznamu požadavků. Ukazujeme rovněž, jak pomocí tohoto dotazovacího jazyka mohou být vyhledány všechny podstatné lingvistické jevy anotované v korpusu. Navržený dotazovací jazyk byl rovněž implementován - zmiňujeme se tedy i o vyhledávacím nástroji a hovoříme o datech pro tento nástroj. Nástroj je možno nainstalovat z přiloženého CD-ROMu.
|
|
An HPSG-based Formal Grammar of a Core Fragment of Georgian Implemented in TRALE
Abzianidze, Lasha ; Rosen, Alexandr (vedoucí práce) ; Hana, Jiří (oponent)
Gruzínština se výrazně odlišuje od indoevropských jazyků. Vyznačuje se řadou jazykových jevů, které jsou obtížné pro lingvistickou teorii i počítačové zpracování. Navíc patří mezi jazyky, u kterých nelze plně využít existující zdroje, a není ani dostatečně prozkoumána z hlediska matematické lingvistiky. Cílem této práce je vytvořit formální gramatiku morfologie a syntaxe jádra gruzínštiny. Tato formální gramatika vychází z teorie HPSG, která je v současnosti jedním z nejúspěšnějších rámců pro formální popis jazyka. Gramatiku implementujeme v systému TRALE, který umožňuje věrné zachycení ručně psaných gramatik založených na HPSG. Tato práce je první aplikací teorie HPSG na gruzínštinu.
|
| |
| |
|
Verbal resources for affective stance display in Japanese conversational interactions
Zawiszová, Halina ; Barešová, Ivona (vedoucí práce) ; Jabłoński, Arkadiusz (oponent) ; Rosen, Alexandr (oponent)
Práce se věnuje verbálním prostředkům vyjadřování afektivního postoje v japonských konverzačních interakcích. Jejím cílem bylo určit významné kategorie verbálních prostředků, které mluvčí japonštiny využívají v neformálních konverzačních interakcích za účelem vyjadřování afektivního postoje, a následně v rámci těchto kategorií určit a popsat vybrané prostředky s ohledem na jejich možné způsoby využití v interakci. Hlavní pozornost byla věnována lexikálním prostředkům, morfologií sloves, ukazovacím zájmenům, citoslovcím, partikulím, způsobům reference, spojovacím výrazům, slovosledu, využití přímé řeči, různým formám otázek a syntakticky nekompletním replikám. Práce je založená na studiu nahrávek spontánních konverzačních interakcí především mladých dospělých v blízkých osobních vztazích. Metodologicky práce čerpá především z konverzační analýzy a interakční lingvistiky.
|
|
Text data mining as an viable method of Japanese studies
Štefková, Tereza ; Kanasugi, Petra (vedoucí práce) ; Rosen, Alexandr (oponent)
Tato práce se zaměřuje na problematiku potenciálního využití metod dolování z textu v oblasti japonských studií. První část práce shrnuje základní přístupy dolování z textu a jejich aplikace v praxi. Dále podáváme podrobný výklad problematiky předzpracování textu, u kterého se soustředíme na techniky používané v případě japonštiny a angličtiny. Hlavní část práce spočívá v aplikaci metod dolování z textu na tři konkrétní výzkumné otázky z oblasti japonských studií. V prvním tématu ukážeme na příkladu děl dvou vybraných japonských proletářských autorů, jak mohou techniky shlukování odhalit zajímavé tematické rysy literárních děl. V případě druhého výzkumného tématu využijeme analýzu sentimentu za účelem vyšetření míry negativního sentimentu, který se objevuje v japonských a zahraničních novinových článcích pojednávajících o návštěvách, které vykonávají japonští představitelé ve svatyni Jasukuni. Nakonec se zaměříme na metody automatického shrnutí dokumentů, které aplikujeme na japonské a anglické texty. Získané výsledky detailně diskutujeme, zvláště se zaměřujeme na vyhodnocení použitelnosti představovaných metod pro japonská studia.
|
|
Coreference from the Cross-lingual Perspective
Novák, Michal ; Žabokrtský, Zdeněk (vedoucí práce) ; Stede, Manfred (oponent) ; Rosen, Alexandr (oponent)
Koreference z mezijazykové perspektivy Michal Novák Tématem této práce je studium vlastností koreference s použitím mezijazy- kových přístupů. Motivací práce je výzkum lingvistické typologie založené na koreferenci. Další motivací je prozkoumání, jestli rozdíly ve způsobech, jak ja- zyky vyjadřují koreferenci, mohou být využity k natrénování lepších modelů pro rozpoznávání koreference. Navrhujeme dvě mezijazykové metody: rozpoznávání koreference s informací z druhého jazyka a projekci koreference. Výsledky našich experimentů s těmito metodami na česko-anglických datech naznačují, že s ohle- dem na koreferenci přináší angličtina více informací do češtiny než naopak. Rozpoznávání koreference s informací z druhého jazyka navíc dokázalo při apli- kaci na paralelních datech překonat na obou jazycích výsledky jednojazykového systému na rozpoznávání. Při experimentech používáme jednojazykový roz- poznávač koreference a vylepšenou metodu na zarovnání koreferenčních výrazů, které jsme rovněž navrhli v rámci této práce. 1
|