Národní úložiště šedé literatury Nalezeno 129 záznamů.  začátekpředchozí100 - 109dalšíkonec  přejít na záznam: Hledání trvalo 0.00 vteřin. 
AJAX CAT - webový editor s podporou pro překlad
Odcházel, Ondřej ; Bojar, Ondřej (vedoucí práce) ; Mareček, David (oponent)
Cílem této práce je implementace systému pro podporu překladu. Systém je rozdělen na serverovou a klientskou část. Serverová část využívá systém strojového překladu ke generování nápověd při překladu. Prvním druhem nápovědy je tabulka s různými variantami překladu každé fráze překládaného textu. Dalším druhem nápovědy jsou návrhy překladu. Tyto návrhy v každé fázi překladu představují nejpravděpodobnější možnosti pokračování překladu. Klientská část systému je webová aplikace ovládaná překladatelem, kterému nabízí nápovědy získané ze serveru. Kromě toho se také klientská část stará o jednoduchou správu překladových dokumentů.
Finding the answer in the answers
Záhumenský, Jakub ; Vidová Hladká, Barbora (vedoucí práce) ; Bojar, Ondřej (oponent)
Názov práce : Hľadanie odpovedí v odpovediach Autor : Jakub Záhumenský Kontakt : zahumensky.jakub@gmail.com Katedra : Ústav formalní a aplikované lingvistiky Vedúca práce : Mgr. Barbora Vidová Hladká, Ph.D. Kontakt : hladka@ufal.mff.cuni.cz Abstrakt : Témou tejto práce je navrhnúť a implementovať dialógový systém, ktorý bude simulovať rozhovor uživateľa s reálnou osobnosťou. Využívať budeme korpus reálnych rozhovorov zozbieraných z webových stránok. V implementácii budeme používať prístup vyhľadávania najpodobnejšej otázky v korpuse s otázkou uživateľa. Odpoveďou na uživateľovu otázku bude následne odpoveď na nájdenú najpodobnejšiu otázku z korpusu. V práci budeme využívať morfologickú a syntaktickú rovinu jazyka, rovnako ako frekvenčnú analýzu pomocou tf-idf váh, na určenie najpodobnejšej otázky. Otázky budú zozbierané v korpuse, ktorého vytvorenie je súčasťou tejto práce. Konkrétne v tejto práci budeme zbierať rozhovory s významnou českou osobnosťou, Václavom Havlom. Aplikácia bude pracovať s textami v českom jazyku.
Google Android Graffiti
Sipták, Daniel ; Bojar, Ondřej (vedoucí práce) ; Spousta, Miroslav (oponent)
V predloženej práci sa sa venujeme návrhu, rozboru a implementácii doty- kovej klávesnice pre OS Android. Táto klávesnica bude používať jednoťahové grafity na zadávanie vstupných znakov. V práci rozoberáme možné riešenia a návrhy rôznych algoritmov na rozpoznávanie ťahu, ktoré taktiež testujeme na ich presnosť.
Statistical Machine Translation between Languages with Significant Word Order Differences
Jawaid, Bushra ; Zeman, Daniel (vedoucí práce) ; Bojar, Ondřej (oponent)
One of the difficulties statistical machine translation (SMT) systems face are differences in word order. When translating from a language with rather fixed SVO word order, such as English, to a language where the preferred word order is dramatically different (such as the SOV order of Urdu, Hindi, Korean, ...), the system has to learn long-distance reordering of the words. Higher degree of freedom of the word order of the target language is usually accompanied by higher morphological diversity, i.e. word affixes have to be generated based on the fixed word order in the source sentence. The goal of the thesis is to explore the two mentioned (and possibly other related) classes of problems in practice, and to implement and evaluate techniques expected to help the SMT system to solve them. This includes: 1. Selecting a language pair with word order differences and collecting parallel data for the pair. 2. Training an existing SMT system on the data. 3. Evaluating the performance of the system and analyzing the errors it does. Estimating how much the accuracy of translation is affected by the problems mentioned above, and possibly what are the other types of error causes that dominate the output. 4. Implementing preprocessing and/or other techniques aimed at minimizing the found classes of errors. Evaluating...
Rich Features in Phrase-Based Machine Translation
Kos, Kamil ; Bojar, Ondřej (vedoucí práce) ; Žabokrtský, Zdeněk (oponent)
V této práci zkoumáme metody, jak zlepšit kvalitu statistického strojového překladu použitím bohaté lingvistické informace. Nejdříve popíšeme SemPOS - metriku, která využívá mělké sémantické reprezentace vět k hodnocení kvality strojového překladu. Ukážeme, že i když tato metrika dosahuje vysoké korelace s lidskými hodnoceními kvality překladu, není samostatně vhodná pro optimalizaci parametrů systémů strojového překladu. Za druhé rozšíříme základní log-lineární model používaný ve statistickém strojovém překladu o kontextový model zdrojové věty, který pomáhá lépe rozlišovat mezi různými možnostmi překladu dané fráze a pomáhá vybrat nejvhodnější překlad pro daný kontext v aktuální větě.
Analýza chyb a možností zlepšení frázového strojového překladu z angličtiny do urdštiny
Ata, Naila ; Bojar, Ondřej (vedoucí práce) ; Zeman, Daniel (oponent)
Diplomová práce vyhodnocuje kvalitu frázového strojového překladu pro překlad z angličtiny do urdštiny. Popisujeme anotační schéma pro chyby v překladu a aplikujeme jej na výstupy systému. Hlavním cílem diplomové práce je experimentovat s rozličnými heuristickými postupy pro zlepšení kvality překladu na základě podrobné ruční analýzy chyb v 200 ukázkových větách. Naše postupy zahrnují 1) předzpracování zdrojové angličtiny, např. změna pořádku slov, 2) předzpracování trénovacích dat pro snížení nadměrné lexikální víceznačnosti, při slovním zarovnávání 3) použití dodatečné anotace v podobě tzv. faktorů pro lepší modelování tvaroslovné ko- herence na cílové straně. Účinek studovaných technik je vyhodnocen pomocí automatické metriky kvality strojového překladu. 1
Combining outputs from machine translation systems
Salim, Fahim ; Žabokrtský, Zdeněk (vedoucí práce) ; Bojar, Ondřej (oponent)
Combining Outputs from Machine Translation Systems By Fahim A. Salim Supervised by: Ing. Zdenek Zabokrtsky, Ph.D Institute of Formal and Applied Linguistics, Charles University in Prague 2010. Abstract: Due to the massive ongoing research there are many paradigms of Machine Translation systems with diverse characteristics. Even systems designed on the same paradigm might perform differently in different scenarios depending upon their training data used and other design decisions made. All Machine Translation Systems have their strengths and weaknesses and often weakness of one MT system is the strength of the other. No single approach or system seems to always perform best, therefore combining different approaches or systems i.e. creating systems of Hybrid nature, to capitalize on their strengths and minimizing their weaknesses in an ongoing trend in Machine Translation research. But even Systems of Hybrid nature has limitations and they also tend to perform differently in different scenarios. Thanks to the World Wide Web and open source, nowadays one can have access to many different and diverse Machine Translation systems therefore it is practical to have techniques which could combine the translation of different MT systems and produce a translation which is better than any of the individual systems....

Národní úložiště šedé literatury : Nalezeno 129 záznamů.   začátekpředchozí100 - 109dalšíkonec  přejít na záznam:
Chcete být upozorněni, pokud se objeví nové záznamy odpovídající tomuto dotazu?
Přihlásit se k odběru RSS.