Národní úložiště šedé literatury Nalezeno 38 záznamů.  začátekpředchozí19 - 28další  přejít na záznam: Hledání trvalo 0.00 vteřin. 
Universal Morphological Analysis using ReinforcementLearning
Cardenas Acosta, Ronald Ahmed ; Zeman, Daniel (vedoucí práce) ; Mareček, David (oponent)
The persistent efforts to make valuable annotated corpora in more diverse, morphologically rich languages has driven research in NLP into considering more explicit techniques to incorporate morphological information into the pipeline. Recent efforts have proposed combined strategies to bring together the transducer paradigm and neural architectures, although ingesting one character at a time in a context-agnostic setup. In this thesis, we introduce a technique inspired by the byte pair encoding (BPE) compression algorithm in order to obtain transducing actions that resemble word formations more faithfully. Then, we propose a neural transducer architecture that operates over these transducing actions, ingesting one word token at a time and effectively incorporating sentential context by encoding per- token action representations in a hierarchical fashion. We investigate the benefit of this word formation representations for the tasks of lemmatization and context-aware morphological tagging for a typologically diverse set of languages, including a low- resourced native language from Peru, Shipibo-Konibo. For lemmatization, we use exploration-based optimization under a reinforcement learning framework, and find that our approach benefits greatly languages that use less commonly studied morphological processes...
Systém slovenské morfologie založený na vzorech
Klocok, Andrej ; Dytrych, Jaroslav (oponent) ; Smrž, Pavel (vedoucí práce)
Cieľom tejto práce je zoznámenie sa s metódami morfologickej analýzy, reprezentáciou dát morfologických slovníkov, vytvorením systému technických vzorov pre flektívnu morfológiu slovenčiny. Z tohto systému je odvodený morfologický analyzátor, ktorý vstupné slová lematizuje, určí ich vzor a morfologickú značku, nástroj pre porovnávanie a vyhodnocovanie stemerov, ktorý hodnotí stemery na základe derivačného slovníka, nástroj na rekonštrukciu diakritiky, ktorý vznikol ako pomocný nástroj. V posledných kapitolách práce sú jednotlivé nástroje zhodnotené, analyzátor je porovnaný s dostupnou alternatívou, pomocou nástroja na hodnotenie stemerov sú porovnané dve implementácie slovenských stemerov a je naznačený ďalší vývoj jednotlivých nástrojov
Zelená perspektiva. Variace zeleného politického myšlení v Česku
Křížkovský, Matyáš ; Slačálek, Ondřej (vedoucí práce) ; Bíba, Jan (oponent)
Předkládaná práce se věnuje českému environmentálnímu hnutí a jeho vývoji v 90. letech, který je v akademickém prostředí rámován debatou o de-radikalizaci. Cílem práce je prozkoumat, jaké konkrétní proměny na poli politických idejí můžeme za pomyslnou de- radikalizací identifikovat. Za tímto účelem je nejprve vyložen historický kontext, v němž hnutí utvářelo své politické představy. Následuje představení teoretických přístupů k analýze ideologií a rozvinutí základních metodologických předpokladů pro morfologickou analýzu periodik Hnutí Duha. Tato analýza ukazuje, že mezi obdobími 1991-1994 a 1998-2000 lze pozorovat významné ideologické proměny, které jsou provázány jednak s příklonem k některým prvkům konzervativního myšlení a jednak také s příklonem k nepolitické politice. Klíčová slova zelené politické myšlení, ideologie, morfologická analýza, environmentální hnutí
Lingvistická charakteristika současného komiksu
Hradečný, Aleš ; Palkosková, Olga (vedoucí práce) ; Chejnová, Pavla (oponent)
Práce se zabývá komiksem a zejména jeho jazykovou stránkou. V první části představuje komiks jako kulturní fenomén a jeho různé definice, z nichž pak vybere nejlepší možnou. Dále se věnuje stručné historii komiksu a jeho vývoji z různých geografických pohledů. Pozornost je věnována jazyku komiksu a zejména jeho specifika, totiž unikátního vztahu slov a obrazů. Ve druhé části je proveden rozbor dvou komiksových knih od autorky Lucie Lomové, totiž Anča a Pepík z roku 1990 a Na odstřel z roku 2014. Výsledky rozborů jsou porovnány a z nich jsou vyvozeny závěry. Na pozadí rozborů jsou představeny společné znaky komiksového jazyka.
Processing of Turkic Languages
Ciddi, Sibel ; Zeman, Daniel (vedoucí práce) ; Hlaváčová, Jaroslava (oponent)
Název: Zpracování turkických jazyků Autor: Sibel Ciddi Katedra: Ústav formální a aplikované lingvistiky, Matematicko-fyzikální fakulta, Univerzita Karlova v Praze Vedoucí diplomové práce: RNDr. Daniel Zeman, Ph.D. Abstrakt: Tato práce představuje a na příkladu turečtiny demon- struje několik metod morfologického zpracování vhodných pro tur- kické jazyky, jejichž počítačové zpracování přináší sadu specifických problémů. Přínosem práce je také značné rozšíření lexikální databáze a souvisejících dat potřebných pro morfologickou analýzu a syntézu; tato data jsou nyní volně dostupná veřejnosti. S ohledem na vysoce produktivní a aglutinační tureckou morfologii a s ní spojenou řídkost dat byl omezený rozsah slovníku významnou překážkou počítačového zpracování jazyka, zvláště pokud jde o zpracování statistickými me- todami. Proto jsme důkladně otestovali a vyhodnotili veřejně do- stupný, na konečných převodnících založený morfologický analyzátor TRmorph. Zaměřili jsme se na rozšíření záběru a slovníku tohoto ana- lyzátoru. Za tím účelem jsme navrhli heuristické metody pro získávání pojmenovaných entit a víceslovných výrazů. Další vylepšení spočívá ve slovníkovém rozpoznávání...
Processing of Turkic Languages
Ciddi, Sibel ; Zeman, Daniel (vedoucí práce) ; Lopatková, Markéta (oponent)
Tato práce se zabývá několika kombinovanými metodami morfologického zpracování turkických jazyků, zejména turečtiny. Sou- částí našich snah bylo i obstarání větších zdrojů jazykových dat, než jaké jsou v současnosti k dispozici, a jejich zpřístupnění veřejnosti. Počítačové zpracování turečtiny zahrnuje specifickou sadu problémů spojených zejména s vysoce produktivní, aglutinační morfologií. Roz- sah veřejně dostupných dat je s ohledem na čistě statistické metody nedostatečný a pro účely strojového učení jsou tato data příliš řídká. Z tohoto důvodu vyhodnocujeme veřejně dostupný morfologický analyzátor TRmorph, založený na konečných převodnících, tedy na pravidlech. Snažíme se rozšířit záběr a slovník tohoto analyzátoru; kombinujeme statistické metody s heuristikami pro rozpoznávání pojmenovaných entit (a konstrukci zeměpisných slovníků), zjednoznačnění morfologické analýzy a zpracování víceslovných výrazů. Výsledky dosavadních experimentů s heuristickými přístupy ukazují slibné rozší- ření pokrytí textu TRmorphem. Statistické metody používáme jako záložní řešení pro jemnější úlohy, které nelze snadno zachytit heuristickými pravidly. Tímto způsobem náš hybridní systém rozšiřuje uplatnění morfologického analyzátoru, jenž je sám postaven čistě na pravidlech. Powered by TCPDF (www.tcpdf.org)
Rekonstrukce pořadí slov ve větách
Dvořák, Tomáš ; Vidová Hladká, Barbora (vedoucí práce) ; Mírovský, Jiří (oponent)
Rekonstrukcí původního pořadí slov věty je v této práci myšleno přerovnání slov věty takovým způsobem, aby vznikla gramaticky korektní věta v daném jazyce. Rekonstrukce původního pořadí slov ve větách je velice užitečná část au- tomatického zpracování přirozeného jazyka počítačem, která může nalézt široké uplatnění. Především velice důležitou roli hraje při automatickém překladu přirozeného jazyka, rozpoznávání řeči nebo při konstrukci umělých komunikačních partnerů. Řešení této úlohy je korpusově orientované a při řešení jsou použity dva přístupy: morfologický a syntaktický. Každý přístup využívá výstup externího modulu, který poskytuje požadované morfologické či syntaktické informace. Re- konstrukční procedura je navržena tak, aby byla jazykove nezávislá. Cílovými jazyky jsou čeština a angličtina. 1
Finding the answer in the answers
Záhumenský, Jakub ; Vidová Hladká, Barbora (vedoucí práce) ; Bojar, Ondřej (oponent)
Názov práce : Hľadanie odpovedí v odpovediach Autor : Jakub Záhumenský Kontakt : zahumensky.jakub@gmail.com Katedra : Ústav formalní a aplikované lingvistiky Vedúca práce : Mgr. Barbora Vidová Hladká, Ph.D. Kontakt : hladka@ufal.mff.cuni.cz Abstrakt : Témou tejto práce je navrhnúť a implementovať dialógový systém, ktorý bude simulovať rozhovor uživateľa s reálnou osobnosťou. Využívať budeme korpus reálnych rozhovorov zozbieraných z webových stránok. V implementácii budeme používať prístup vyhľadávania najpodobnejšej otázky v korpuse s otázkou uživateľa. Odpoveďou na uživateľovu otázku bude následne odpoveď na nájdenú najpodobnejšiu otázku z korpusu. V práci budeme využívať morfologickú a syntaktickú rovinu jazyka, rovnako ako frekvenčnú analýzu pomocou tf-idf váh, na určenie najpodobnejšej otázky. Otázky budú zozbierané v korpuse, ktorého vytvorenie je súčasťou tejto práce. Konkrétne v tejto práci budeme zbierať rozhovory s významnou českou osobnosťou, Václavom Havlom. Aplikácia bude pracovať s textami v českom jazyku.
Slovenská lemmatizace
Lipták, Šimon ; Dytrych, Jaroslav (oponent) ; Smrž, Pavel (vedoucí práce)
Cieľom tejto bakalárskej práce bolo zoznámiť sa s nástrojmi a metódami pre morfologickú analýzu a lematizáciu slov, navrhnúť a implementovať systém, ktorý dokáže lematizovať slovenské slová, ktoré sa nenachádzajú v slovníku a následne vypísať vyskloňované tvary, spracovať slovenské dáta pre implementáciu stemmingu. Na záver vyhodnotiť úspešnosť na základe testovania a porovnať s dostupnými alternatívami.

Národní úložiště šedé literatury : Nalezeno 38 záznamů.   začátekpředchozí19 - 28další  přejít na záznam:
Chcete být upozorněni, pokud se objeví nové záznamy odpovídající tomuto dotazu?
Přihlásit se k odběru RSS.