Národní úložiště šedé literatury Nalezeno 53 záznamů.  začátekpředchozí51 - 53  přejít na záznam: Hledání trvalo 0.01 vteřin. 
Vyhodnocování podobnosti českých textů
Cvengroš, Petr ; Kuboň, Vladislav (oponent) ; Holan, Tomáš (vedoucí práce)
V předložené práci studujeme porovnávání dvou českých textů. Je popsán návrh a principy implementace programu na porovnávání dvou textů pomocí sady rozličných kritérií, nová kritéria se dají snadno přidávat. Program je schopen se učit, učení probíhá konfigurací programu na textech zadaných uživatelem. V první části práce se zabýváme popisem algoritmů pro porovnávání textů a učení. Další část je věnována zajímavým částem implementace. V závěru se popisuje využití programu na reálných textech.
Automatické hodnocení kvality paralelních dvojjazyčných dat
Kolovratník, David ; Kuboň, Vladislav (vedoucí práce) ; Pecina, Pavel (oponent)
Statistický strojový překlad je metoda závislá zejména na velkém množství paralelních dvojjazyčných dat. Ty se používa jí pro trénování překladového modelu. Ten pak zastupuje úlohu pravidlového transferu, v některých systémech lexikálního. Věří se, že kvalitu překladu lze zlepšovat přidáváním trénovacích dat. Zkusil jsem naopak trénovací data zmenčovat a sledovat, jak se bude vyvíjet hodnocení překladu. Větné páry, které zůstanou ve zmeněném korpusu jsem vybíral postupně podle těch růných klíčů jednou náhodně, jednou podle poměru délek vět a nakonec podle počtu párů slov, které zná slovník jako překladové ekvivalenty. Ukázal jsem, že nejenže vhodný výběr větných párů do menšího korpusu zpomalí pokles NIST a BLEU ho dno cení se zmenšujícím se korpusem, ale dokonce může vést k lepšímu hodnocení. Zmenšení trénovacích dat vedlo také ke zrychlení vyhodnocení a nižším nárokům na prostor. To může být užitečné při implementaci strojového překladu v malých zařízeních s omezenými systémovými prostředky.
Kontextově závislý slovník pro překladatele
Fanta, Petr ; Bojar, Ondřej (vedoucí práce) ; Kuboň, Vladislav (oponent)
Při ručním překládání krátkých textů, jaké se vyskytují například na sociálních sítích, či mikroblozích (Twitter a podobně), je překladatel často nucen dohledávat doplňující informace v různých zdrojích. Může se jednat o méně běžná slova, o specifické termíny z neznámé domény, či o různé zkratky. V této práci se zabýváme návrhem a implementací systému, který pro danou krátkou textovou zprávu automaticky sestaví minimální kontextově závislý slovník. Systém v překládaném textu vybírá vhodná hesla do slovníku a vyhledává k nim definice, překlady a příklady v otevřených zdrojích, či je automaticky extrahuje z paralelního korpusu. Získaný slovníček v ideálním případě bude pro překladatele již dostačujícím podkladem, aby překládanou zprávu s jistotou pochopil a zvolil odpovídající překladové ekvivalenty včetně odborných termínů. Empirické vyhodnocení se opírá o statistiky sledující, jak často byli uživatelé s navrženými hesly spokojeni, jak často byla hesla chybná a do jaké míry systém správně určil relevanci pro daný vstupní text.

Národní úložiště šedé literatury : Nalezeno 53 záznamů.   začátekpředchozí51 - 53  přejít na záznam:
Chcete být upozorněni, pokud se objeví nové záznamy odpovídající tomuto dotazu?
Přihlásit se k odběru RSS.