Národní úložiště šedé literatury Nalezeno 60 záznamů.  předchozí11 - 20dalšíkonec  přejít na záznam: Hledání trvalo 0.00 vteřin. 
Automatické zjednodušování textů pro překlad
Prokopová, Magdalena ; Kuboň, Vladislav (vedoucí práce) ; Zeman, Daniel (oponent)
Tato práce se zabývá využitím automatického zjednodušování (simplifi akce) textů pro účely automatického překladu. Práce srovnává automatické zjednodušování a kotrolované psaní, co mají společného a jaké jsou jejich rozdíly. Dále se zaměřuje na zjednodušování v souvislosti s automatickým překladem. Je popsáno jaké problémy může zjednodušování vyřešit a pro část z nich je řešení navrženo. V rámci práce byl implementován systém ASOFT, který provádí vybrané transformace na větách. Výsledky systému ASOFT ve spojení se systémem automatického překladu PC Transaltor byly vyhodnoceny pomocí několika metrik, zvolili jsem automatické vyhodnocení pomocí BLEU a NIST a vyhodnocení provedené lidskými anotátory. V závěru nastiňujeme jakými dalšími způsoby by se dané téma mohlo rozvíjet.
Robust Parsing of Noisy Content
Daiber, Joachim ; Zeman, Daniel (vedoucí práce) ; Mareček, David (oponent)
Ačkoli úspěšnost syntaktické analýzy (parsingu) doménově shodných textů se v posledních letech soustavně zvyšuje, texty mimo trénovací doménu a gramaticky problematické texty nadále vzdorují a často na nich pozorujeme výrazný pokles v kvalitě. V této práci se zaměřujeme na analýzu "zašuměného" vstupu pocházejícího ze služeb, jako je Twitter. Zkoumáme otázku, zda předzpracování textu založené na strojovém překladu a neřízených normalizačních modelech může zvýšit úspěšnost analýzy takových dat. Zkoumané postupy vyhodnocujeme na existujících testovacích datech, kromě toho jsme vytvořili i vlastní data pro závislostní syntaktickou analýzu zašuměných dat z Twitteru. Ukazujeme, že normalizace textu kombinovaná s obecnými i doménově zaměřenými taggery může vést k významnému zlepšení kvality parsingu. Powered by TCPDF (www.tcpdf.org)
Statistical Machine Translation between Languages with Significant Word Order Differences
Jawaid, Bushra ; Zeman, Daniel (vedoucí práce) ; Bojar, Ondřej (oponent)
One of the difficulties statistical machine translation (SMT) systems face are differences in word order. When translating from a language with rather fixed SVO word order, such as English, to a language where the preferred word order is dramatically different (such as the SOV order of Urdu, Hindi, Korean, ...), the system has to learn long-distance reordering of the words. Higher degree of freedom of the word order of the target language is usually accompanied by higher morphological diversity, i.e. word affixes have to be generated based on the fixed word order in the source sentence. The goal of the thesis is to explore the two mentioned (and possibly other related) classes of problems in practice, and to implement and evaluate techniques expected to help the SMT system to solve them. This includes: 1. Selecting a language pair with word order differences and collecting parallel data for the pair. 2. Training an existing SMT system on the data. 3. Evaluating the performance of the system and analyzing the errors it does. Estimating how much the accuracy of translation is affected by the problems mentioned above, and possibly what are the other types of error causes that dominate the output. 4. Implementing preprocessing and/or other techniques aimed at minimizing the found classes of errors. Evaluating...
Implementace rozšířené hry Quoridor
Trojánek, Tomáš ; Mírovský, Jiří (vedoucí práce) ; Zeman, Daniel (oponent)
V předložené práci je analyzována klasická desková hra Quoridor a následně její implementace do podoby počítačové aplikace pro více hráčů. Nejprve se popisují pravidla a rozšíření od klasického znění - tedy přidání nového druhu překážek a zobecnění herní plochy pro více hráčů. Tato specifika Quoridor pozměňují a vnášejí nové problémy. Ty jsou rozebrány a zasazeny do kontextu úloh, které se musí řešit u deskových her obecně. Následuje popis algoritmů a matematických úvah, z nichž práce vychází a které řeší otázky efektivní implementace. Uvedeno je porovnání s klasickými verzemi hry. Nakonec je rozebrán návrh, realizace a důležité mechanismy programu, který obsahuje mimo jiné konkrétní implementace algoritmů, jež se v textu rozebírají. Program umožňuje vyzkoušet uvedené poznatky v praxi. Jedná se o síťovou aplikaci pro více hráčů s možností počítačových protivníků.
Analýza chyb a možností zlepšení frázového strojového překladu z angličtiny do urdštiny
Ata, Naila ; Bojar, Ondřej (vedoucí práce) ; Zeman, Daniel (oponent)
Diplomová práce vyhodnocuje kvalitu frázového strojového překladu pro překlad z angličtiny do urdštiny. Popisujeme anotační schéma pro chyby v překladu a aplikujeme jej na výstupy systému. Hlavním cílem diplomové práce je experimentovat s rozličnými heuristickými postupy pro zlepšení kvality překladu na základě podrobné ruční analýzy chyb v 200 ukázkových větách. Naše postupy zahrnují 1) předzpracování zdrojové angličtiny, např. změna pořádku slov, 2) předzpracování trénovacích dat pro snížení nadměrné lexikální víceznačnosti, při slovním zarovnávání 3) použití dodatečné anotace v podobě tzv. faktorů pro lepší modelování tvaroslovné ko- herence na cílové straně. Účinek studovaných technik je vyhodnocen pomocí automatické metriky kvality strojového překladu. 1
Strojový překlad do češtiny přes lematický text
Viktorinová, Eva ; Bojar, Ondřej (vedoucí práce) ; Zeman, Daniel (oponent)
Bakalářská práce se zabývá možností vylepšení překladu z angličtiny do češtiny. Popisuje problém bohaté české morfologie a navrhuje několik metod řešení tohoto problému převedením češtiny na lematický text. Podrobněji zpracovává překlad využitím alternativních dekódovacích cest, kde první cesta překládá z angličtiny do tvarované češtiny a druhá z angličtiny do lematické češtiny.
Školní větné rozbory jako možný zdroj závislostních korpusů (?)
Konárová, Marie ; Vidová Hladká, Barbora (vedoucí práce) ; Zeman, Daniel (oponent)
Cílem práce je prozkoumat možnosti využití dat ze školních větných roz- borů pro značkování slov v jazykových korpusech. Za účelem ověření této hy- potézy byla vybrána množina vět, které byly předloženy žákům základních a středních škol k větnému rozboru. Sběr dat probíhal s využitím funkčního prototypu editoru větných rozborů Čapek. Editor je stále vyvíjen, mimo jiné i na základě zpětné vazby získané při jeho používání žáky i učiteli. Na základě nasbíraných dat byla odvozena transformační pravidla pro konverzi údajů ze školních větných rozborů do datových struktur využívaných Pražským závis- lostním korpusem. Byla testována jak úspěšnost konverze pomocí navržených pravidel, tak přesnost žáků při provádění větných rozborů. 1
Exploring Higher Order Dependency Parsers
Madhyastha, Pranava Swaroop ; Zeman, Daniel (vedoucí práce) ; Ramasamy, Loganathan (oponent)
Syntakticka analyza jejednim z nejdulezitejsich kroku pocitacoveho zpracovani pfirozenych jazyku. V teto praci se zamefujeme na formalismus zavislostni gramatiky, protoze jeho hlavnf principy, zejmena vztah fidiciho a zavisleho uzlu, se ukazaly uzitecne pro fadu rozdilnych jazyku, se zvlastnim zfetelem na vysvetleni slovosledu a vztahu mezi povrchovou strukturou a vyznamem. Vetsina modernich efektivnich algoritmu zavislostni syntakticke analyzy je zalozena na faktorizaci zavislostnich stromu. Ve vetsine techto pffstupu analyzator (parser) ztraci znacnou cast kontextove informace behem procesu faktorizace. V teto praci zkoumame, jak syntakticko-semanticke rysy ovlivnuji metody diskriminativniho strojoveho uceni vyssiho fadu pro zavislostni syntaktickou analyzu. Ukazujeme, ze lingvisticke rysy v mnoha pfipadech pfinaseji vyznamne zlepseni lispesnosti. Nejdrive pfinasime pfehled nekolika diskriminativnich metod uceni pro grafove statisticke zavislostni parsery a vysvetlujeme koncept vyssiho fadu, coz je zobecneni prace (Koo a Collins 2010) a (McDonald et al. 2006). Tonas dovede kjadru prace - rysovemu inzenyrstvi pro zavislostni parsery vyssiho fadu. Experimentujeme s nekolika syntakticko-semantickymi rysy a snazime se vysvetlit jejich teoreticke zaklady. Pokusy provadime na dvou odlisnych jazycich -...
Creating a Bilingual Dictionary using Wikipedia
Ivanova, Angelina ; Zeman, Daniel (vedoucí práce) ; Straňák, Pavel (oponent)
Název práce: Tvorba dvojjazycného slovníku s použitím Wikipedie Autor: Angelina Ivanova Katedra/ Ústav: Ústav formální a aplikované lingvistiky (32-ÚFAL) Vedoucí diplomové práce: RNDr. Daniel Zeman Ph.D. Abstrakt: Strojove citelné slovníky hrají duležitou roli v pocítacové lingvistice. Osved- cily se v oblastech jako je strojový preklad a mezijazykové dobývání informací. V této práci zkoumáme kvalitu a obsah dvojjazycných anglicko-ruských slovníku automaticky získaných z Wikipedie. Slovníky získané z Wikipedie (zde jim pro jednoduchost ríkáme Wiki-slovníky, ale tento pojem nelze zamenovat s Wikislovníkem na http://cs.wiktionary.org) se podstatne liší od tradicních slovníku: pokrytí základní terminologie z Muellerova slovníku je 7,42 %. Pokusy s Wiki-slovníky zabudovanými do trénovacích dat pro strojový preklad vedly k malému, nicméne statisticky významnému poklesu kvality prekladu ve srovnání s experimenty bez Wiki-slovníku. Predpokládáme, že hlavním duvodem je rozdílnost domén mezi slovníkem a korpusem. Na testovacích datech získaných z clánku Wikipedie naopak slovník kvalitu prekladu zlepšuje. V této práci ukazujeme, jak velký je rozdíl mezi slovníky získanými ze struk- tury Wikipedie a tradicními slovníky. Wiki-slovníky...

Národní úložiště šedé literatury : Nalezeno 60 záznamů.   předchozí11 - 20dalšíkonec  přejít na záznam:
Viz též: podobná jména autorů
11 ZEMAN, David
2 Zeman, Dalibor
11 Zeman, David
4 Zeman, Dominik
Chcete být upozorněni, pokud se objeví nové záznamy odpovídající tomuto dotazu?
Přihlásit se k odběru RSS.