Národní úložiště šedé literatury Nalezeno 53 záznamů.  začátekpředchozí44 - 53  přejít na záznam: Hledání trvalo 0.00 vteřin. 
Segmentační analýza českých vět
Procházka, Jan ; Holan, Tomáš (oponent) ; Kuboň, Vladislav (vedoucí práce)
Cílem této práce je implementace segmentační analýzy českého jazyka včetně vytvoření seznamu separátorů. Kromě toho je zde navržena a implementována metoda rozdělení do klauzí. Implementace využívá český morfologický analyzátor prof. Hajiče. Samotný program je napsán v Pythonu. Metoda byla odladěna na korpusu 62 vět a otestována na korpusu velikosti 80 vět.
Automatické zjednodušování textů pro překlad
Prokopová, Magdalena ; Zeman, Daniel (oponent) ; Kuboň, Vladislav (vedoucí práce)
Tato práce se zabývá využitím automatického zjednodušování (simplifi akce) textů pro účely automatického překladu. Práce srovnává automatické zjednodušování a kotrolované psaní, co mají společného a jaké jsou jejich rozdíly. Dále se zaměřuje na zjednodušování v souvislosti s automatickým překladem. Je popsáno jaké problémy může zjednodušování vyřešit a pro část z nich je řešení navrženo. V rámci práce byl implementován systém ASOFT, který provádí vybrané transformace na větách. Výsledky systému ASOFT ve spojení se systémem automatického překladu PC Transaltor byly vyhodnoceny pomocí několika metrik, zvolili jsem automatické vyhodnocení pomocí BLEU a NIST a vyhodnocení provedené lidskými anotátory. V závěru nastiňujeme jakými dalšími způsoby by se dané téma mohlo rozvíjet.
Využití lingvistických informací při EBMT
Týnovský, Miroslav ; Žabokrtský, Zdeněk (oponent) ; Kuboň, Vladislav (vedoucí práce)
Metoda strojového překladu založená na příkladech (EBMT) je korpusová metoda strojového překladu, která se pokouší získat překlad vstupního textu pomocí analogie s překladem textu podobného již hotového. Tato práce zkoumá význam využití lingvistické informace v této metodě překladu, a to konkrétně na dvou jazykových párech: čeština-angličtina a čeština-němčina. Zahrnuje shromáždění anotovaných paralelních dat pro jazykový pár čeština-němčina, návrh experimentálního EBMT systému, jeho implementaci a vylepšování jeho části s použitím lingvistických informací. Práce také obsahuje podrobné vyhodnocení jak výchozího systému, tak systému využívajícího informace o morfologii a syntaxi a jejich porovnání. Vyhodnocení systému bylo provedeno jednak automatickými metodami BLEU, NIST a METEOR a jednak ručně za pomoci anotátorů. Lingvistické informace aplikované na experimentální EBMT systém zahrnují morfologické a syntaktické porovnávání vstupní věty s příklady v překladové paměti.
Symbolic derivations of functions with a single real variable
Skotnický, Stanislav ; Mírovský, Jiří (oponent) ; Kuboň, Vladislav (vedoucí práce)
Cieľom bakalárskej práce bude vytvoriť program na symbolické derivovanie funkcie jednej reálnej premennej s možnosťou využívania parametrov. Okrem derivácií bude program schopný zjednodušovať výrazy a funkcie. Program bude tiež schopný funkciu vykresľovať, a to pomocou upravenej Epsilonovej metódy. Program bude schopný kontrolovať syntaktickú správnosť výrazov, bude v základnej variante podporovať použitie binárnych operácií +,-,*,/,^, unárnych operácií a goniometrických funkcií, je vhodné uvažovať i o rozšírení o absolútnu hodnotu, exponenciálu a logaritmus. Program by mal rozpoznať i niektoré základné konštanty ako e apod. Samozrejmou súčasťou zadania je i požiadavka na komfortné a príjemné užívateľské rozhranie.
Lokalizace softwaru a překladatelské nástroje. Případová studie: Mozilla Firefox v2.0
Dolejš, Jan ; Nemejovský, Jan (vedoucí práce) ; Kuboň, Vladislav (oponent)
Lokalizace softwaru představuje jeden z nejdynamičtěji rostoucích specializovaných sektorů poslední doby. Rozmach této oblasti umožnilo zejména masivní rozšíření výpočetní techniky v 90. letech 20. století, následné zavádění standardů IT a rozvíjení infrastruktury celosvětové internetové sítě. Znalost kulturních specifik využívají k průniku na jednotlivé národní trhy globálně působící společnosti, potřeba komunikace v mateřském jazyce ovšem vychází rovněž od samotných koncových uživatelů výpočetní techniky. V diplomové práci se věnuji nástinu historie lokalizačního odvětví, činnosti a vlivu standardizačních institucí na jeho další směrování a obecně uznávaným zásadám lokalizace softwarových aplikací. Uvádím možnosti využití technologických nástrojů pro lokalizaci uživatelského rozhraní z pohledu překladatele a zabývám se lokalizací programového vybavení s otevřeným zdrojovým kódem. Součást práce tvoří případová studie lokalizace webového prohlížeče do češtiny, glosář termínů a tematické přílohy
Deep analysis in IQA: evaluation on real users dialogues.
Ratkovic, Zorana ; Kuboň, Vladislav (vedoucí práce) ; Hoffmannová, Petra (oponent)
Interactive Question Answering (IQA) is a natural and cohesive way for a user to obtain information by interactive with a system using natural language. With the advancement in Natural Language Processing, research in the eld of IQA has started to focus on the role of semantics and the discourse structure in these systems. The need for a deeper analysis, which examines the syntax and semantics of the questions and the answers is evident. Using this deeper analysis allows us to model the context of the interaction. I will look at a current closeddomain IQA system which is based on Linear Regression modeling. This system uses super cial and non-semantically motivated features. I propose adding deep analysis and semantic features in order to improve the system and show the need for such analysis. Particular attention will be placed on the so-called follow-up questions (questions that the user poses after having received some answer from the system) and the role of context. I propose that adding the linguistically heavy features will prove bene cial, thereby showing the need for such analysis in IQA systems.
Vyhodnocování podobnosti českých textů
Cvengroš, Petr ; Kuboň, Vladislav (oponent) ; Holan, Tomáš (vedoucí práce)
V předložené práci studujeme porovnávání dvou českých textů. Je popsán návrh a principy implementace programu na porovnávání dvou textů pomocí sady rozličných kritérií, nová kritéria se dají snadno přidávat. Program je schopen se učit, učení probíhá konfigurací programu na textech zadaných uživatelem. V první části práce se zabýváme popisem algoritmů pro porovnávání textů a učení. Další část je věnována zajímavým částem implementace. V závěru se popisuje využití programu na reálných textech.
Automatické hodnocení kvality paralelních dvojjazyčných dat
Kolovratník, David ; Kuboň, Vladislav (vedoucí práce) ; Pecina, Pavel (oponent)
Statistický strojový překlad je metoda závislá zejména na velkém množství paralelních dvojjazyčných dat. Ty se používa jí pro trénování překladového modelu. Ten pak zastupuje úlohu pravidlového transferu, v některých systémech lexikálního. Věří se, že kvalitu překladu lze zlepšovat přidáváním trénovacích dat. Zkusil jsem naopak trénovací data zmenčovat a sledovat, jak se bude vyvíjet hodnocení překladu. Větné páry, které zůstanou ve zmeněném korpusu jsem vybíral postupně podle těch růných klíčů jednou náhodně, jednou podle poměru délek vět a nakonec podle počtu párů slov, které zná slovník jako překladové ekvivalenty. Ukázal jsem, že nejenže vhodný výběr větných párů do menšího korpusu zpomalí pokles NIST a BLEU ho dno cení se zmenšujícím se korpusem, ale dokonce může vést k lepšímu hodnocení. Zmenšení trénovacích dat vedlo také ke zrychlení vyhodnocení a nižším nárokům na prostor. To může být užitečné při implementaci strojového překladu v malých zařízeních s omezenými systémovými prostředky.
Kontextově závislý slovník pro překladatele
Fanta, Petr ; Bojar, Ondřej (vedoucí práce) ; Kuboň, Vladislav (oponent)
Při ručním překládání krátkých textů, jaké se vyskytují například na sociálních sítích, či mikroblozích (Twitter a podobně), je překladatel často nucen dohledávat doplňující informace v různých zdrojích. Může se jednat o méně běžná slova, o specifické termíny z neznámé domény, či o různé zkratky. V této práci se zabýváme návrhem a implementací systému, který pro danou krátkou textovou zprávu automaticky sestaví minimální kontextově závislý slovník. Systém v překládaném textu vybírá vhodná hesla do slovníku a vyhledává k nim definice, překlady a příklady v otevřených zdrojích, či je automaticky extrahuje z paralelního korpusu. Získaný slovníček v ideálním případě bude pro překladatele již dostačujícím podkladem, aby překládanou zprávu s jistotou pochopil a zvolil odpovídající překladové ekvivalenty včetně odborných termínů. Empirické vyhodnocení se opírá o statistiky sledující, jak často byli uživatelé s navrženými hesly spokojeni, jak často byla hesla chybná a do jaké míry systém správně určil relevanci pro daný vstupní text.

Národní úložiště šedé literatury : Nalezeno 53 záznamů.   začátekpředchozí44 - 53  přejít na záznam:
Chcete být upozorněni, pokud se objeví nové záznamy odpovídající tomuto dotazu?
Přihlásit se k odběru RSS.