Národní úložiště šedé literatury Nalezeno 53 záznamů.  začátekpředchozí31 - 40dalšíkonec  přejít na záznam: Hledání trvalo 0.00 vteřin. 
Measures of Machine Translation Quality
Macháček, Matouš ; Bojar, Ondřej (vedoucí práce) ; Kuboň, Vladislav (oponent)
Název práce: Měření kvality strojového překladu Autor: Matouš Macháček Ústav: Ústav formální a aplikované lingvistiky Vedoucí diplomové práce: RNDr. Ondřej Bojar, Ph.D. Abstrakt: V této práci zkoumáme manuální i automatické metody pro vy- hodnocování kvality strojového překladu. Navrhujeme manuální metodu evaluace, ve které anotátoři hodnotí místo celých vět pouze krátké úseky strojového překladu, což zjednodušuje a zefektivňuje anotaci. Provedli jsme anotační experiment a vyhodnotili jsme systémy strojového překladu podle této metody. Získané výsledky jsou velmi podobné těm z oficiálního vy- hodnocení systémů v rámci sotěže WMT14. Získanou databázi anotací dále používáme k evaluaci nových, neviděných systémů a k ladění parametrů stati- stického strojového překladače. Evaluace nových systémů ale dává nepřesné výsledky a v práci proto analyzujeme důvody tohoto neúspěchu. V rámci zkoumání automatických metod evaluace jsme dvakrát po sobě organizovali soutěž strojových metrik v rámci workshopu WMT. V této práci uvádíme výsledky z poslední soutže, diskutujeme různé metody metaevaluace a ana- lyzujeme některé zúčastněné metriky. Klíčová slova: strojový překlad, vyhodnocování kvality,...
Porovnáni metod česko-ruského automatického překladu
Bílek, Karel ; Kuboň, Vladislav (vedoucí práce) ; Bojar, Ondřej (oponent)
V této práci představuji několik metod česko-ruského automatického pře- kladu, včetně jak více historických, tak více moderních systémů, a včetně jak frá- zových, tak pravidlových systémů. Nejdříve stručně popisuji lingvistické základy češtiny a ruštiny a jejich společnou historii a rozdíly. Poté popisuji automatizaci, vytváření a zlepšování některých ze systémů automatického překladu, společně s je- jich porovnáním, s použitím jak automatických metrik, tak omezené lidské anotace. Zároveň s tím také popisuji vytvoření několika korpusů česko-ruských paralelních dat a ruských monolingválních dat.
Spojování segmentů v českých souvětích
Čech, Josef ; Kuboň, Vladislav (vedoucí práce) ; Krůza, Oldřich (oponent)
Název diplomové práce: Spojování segmentů v českých souvětích Autor: Bc. Josef Čech Katedra (ústav): ÚFAL - Ústav formální a aplikované lingvistiky Vedoucí diplomové práce: doc. RNDr. Vladislav Kuboň Ph.D. e-mail: vk@ufal.mff.cuni.cz Abstrakt: Práce se zabývá studiem lingvisticky motivovaných částí vět - segmenty - a jejich vzájemnými vztahy. Vztahy mezi segmenty popisují jejich slučování do větších větných celků - klauzí. Detekovat segmenty je možné pomocí definice lingvistických oddělovačů založené na pravidlovém přístupu. Tento přístup se osvědčil i při určování vztahů mezi sousedními segmenty. Práce má za úkol zjistit, zda je možné pomocí pravidlového přístupu získat ze segmentů i klauze. Zároveň při práci vznikl návrh pozičního tagování segmentů. Tag segmentu popisuje jednotlivé vlastnosti segmentu jako celek. V metodách analýzy vztahů segmentů je plně zaměnitelný za celý segment. Klíčová slova: segment, klauze, tag, spojování segmentů, syntaktická analýza
Vývojové prostředí rozšiřující možnosti řízení dialogu v AIML
Brodec, Václav ; Kuboň, Vladislav (vedoucí práce) ; Plátek, Ondřej (oponent)
Jazyk AIML vznikl jako nástroj na tvorbu jednoduchých konverzačních agentů. Proto postrádá některé z vlastnosti pokročilých dialogových systémů. Jednou z nich je podpora pro řízení dialogu. Ta je přitom užitečná v mnoha aplikacích, v nichž byl jazyk díky své popularitě nasazen. Práce řeší problém implementace řízení dialogu v čistém AIML. A to nasazením rozšířených přechodových sítí při návrhu a generování zdrojového kódu. Jejím výsledkem je vývojové prostředí, které podporuje zvolený postup, a podstatně tak usnadňuje návrh složitějších robotů, aniž by bylo nutné uchýlit se k rozšíření standardního interpretu.
Spojování segmentů v českých souvětích
Čech, Josef ; Kuboň, Vladislav (vedoucí práce) ; Krůza, Oldřich (oponent)
Název diplomové práce: Spojování segmentů v českých souvětích Author: Bc. Josef Čech Katedra (ústav): ÚFAL - Ústav formalní a aplikované lingvistiky Vedoucí diplomové práce: doc. RNDr. Vladislav Kuboň Ph.D. e-mail: vk@ufal.mff.cuni.cz Abstrakt: Práce se zabývá studiem lingvisticky motivovaných částí vět - segmenty - a jejich vzájemnými vztahy. Vztahy mezi segmenty popisuji jejich slučování do větších větných celků - klauzí. Detekovat segmenty je možné pomocí definice lingvistických oddělovačů založené na pravidlovém přístupu. Tento přístup se osvědčil i při určování vztahů mezi sousedními segmenty. Práce má za úkol zjistit zda je možné pomocí pravidlového přístupu získat ze segmentů i klauze. Zároveň při práci vznikl návrh pozičního tagování segmentů. Tag segmentu popisuje jednotlivé vlastnosti segmentu jako celek. V metodách analýzy vztahů segmentů je plně zaměnitelný za celý segment. Klíčová slova: segment, klauze, tag, spojování segmentů, syntaktická analýza
Methods for Creating Subjectivity Lexicon for Indonesian
Franky, ; Bojar, Ondřej (vedoucí práce) ; Kuboň, Vladislav (oponent)
Cílem naší práce byla tvorba slovníků subjektivity pro indonéštinu překladem již existujících anglických slovníků a jejich následnou kombinací průnikem a sjed- nocením. Porovnali jsme efektivnost výsledných slovníků pomocí jednoduché prediktivní metody, která měří a porovnává počet výskytů kladných a záporných výrazů ve větě. Použili jsme také dvě různé hodnotící funkce založené jak na četnosti tak na relativní četnosti výrazů v neanotovaných datech. Úpravou predik- tivní metody využívající strojového učení jsme posléze lépe začlenili údaje, které nemohly být zachyceny jednoduchou predikcí. Dále jsme ukázali, že slovníky byly v predikci na testovacích větách schopny dosáhnout vysokého pokrytí ale nízké přesnosti. Ohodnocování výrazů dokáže zlepšit pokrytí či přesnost, ovšem však vždy i se srovnatelným poklesem v druhé metrice. Predikce na bázi stro- jového učení byla schopna minimalizovat citlivost výkonu na velikosti slovníku, bude však zapotřebí dalších experimentů, aby se nalezla nejlepší volba prediktivní metody. 1
Hybrid Machine Translation Approaches for Low-Resource Languages
Kamran, Amir ; Popel, Martin (vedoucí práce) ; Kuboň, Vladislav (oponent)
V poslední době poskytují systémy automatického překladu založené na korpusových datech dobré výsledky pro celou řadu jazykových párů. Ty jazyky, pro které není k dispozici dostatek dat (jako např. Urdu), však při použití čistě statistických nebo příkladových metod dobré výsledky nemají. Na druhou stranu, metody založené na pravidlech vyžadují obrovské množství času a zdrojů pro vývoj pravidel, což je ve většině případů příliš náročné. Jedním z možných řešení se jeví hybridní systémy automatického překladu, ve kterých je možné kombinovat to nejlepší z různých přístupů za účelem dosažení kvalitního překladu. Tato práce zkoumá různé kombinace přístupů a vyhodnocuje jejich výkon v porovnání se standardně používanými korpusovými metodami. Zahrnuje: 1. Použití syntaktických a závislostních přerovnávacích pravidel v kombinaci se statistickým strojovým překladem. 2. Automatickou extrakci lexikálních a syntaktických pravidel využívající statistické metody pro strojový překlad prostřednictvím transferu. Novým prvkem je v této práci vývoj algoritmu, který se automaticky učí přerovnávací pravidla pro anglicko-urdský statistický automatický překlad. Tento přístup je navíc rozšířen na učení se lexikálních a syntaktických pravidel pro možné vybudování překladového systému založeného na pravidlech.
Implementace metod analýzy struktury českých souvětí.
Dutkevič, Jiří ; Kuboň, Vladislav (vedoucí práce) ; Holan, Tomáš (oponent)
Název práce: Implementace metod analýzy struktury českých souvětí. Autor: Jiří Dutkevič Katedra / Ústav: Ústav formální a aplikované lingvistiky Vedoucí bakalářské práce: doc. RNDr. Vladislav Kuboň, Ph.D., Ústav formální a aplikované lingvistiky Abstrakt: Práce se zabývá automatickou analýzou struktur souvětí v češtině. Shrnuje výsledky předchozího výzkumu, užívá v něm navržené metody rozdělení souvětí do segmentů pomocí přesně definované množiny separátorů a na základě přednesených pravidel navrhuje tři metody automatického určování úrovní jednotlivých segmentů v souvětí a tím i jejich vzájemných vztahů. Jedna metoda přímo využívá pravidel navržených v odkazovaném výzkumu, druhá používá genetický algoritmus a třetí neuronovou síť. Práce obsahuje implementaci těchto metod a vyhodnocení výsledků na ručně anotovaných datech z Pražského závislostního korpusu.
Vyhledávání v českých strukturovaných datech pomocí stemmingu
Tattermusch, Jan ; Hlaváčová, Jaroslava (vedoucí práce) ; Kuboň, Vladislav (oponent)
Tato práce implementuje a popisuje komponentu pro fulltextové vyhledávání s podporou eského doplování diakritiky a stemmingu. Doplňovač diakritiky pracuje na statistickém principu a zohleduje kontext. Práce obsahuje pět stemmerů připravených k okamžitému použití (dva algoritmické a tři hybridní), jejichž vlastnosti jsou diskutovány. Komponenta je vystavěna nad knihovnou Apache Lucene a poskytuje jednoduché rozhraní pro dotazování a přidávání, mazání a změnu indexovaných dokumentů. Ukládané dokumenty se skládají z pojmenovaných polí s de novanými datovými typy. Komponenta umožňuje de novat krom běžných fulltextových dotaz také netriviální dotazy s dopňujícími omezeními a ovlivnit vlastní zpasob výpočtu skóre výsledků dotazu. Výkon komponenty je dostatečný pro středně vytížené aplikace a orientační výkon je dle měření 50 dotazů za vteřinu nad úložištěm obsahujícím 2,7 milionu dokumenta. Přínos doplňování diakritiky a stemmingu pro kvalitu fulltextového vyhledávání byl měřen pomocí MAP a byl vyhodnocen jako významný.
Machine Translation of Related Asian Languages
Larasati, Septina Dian ; Kuboň, Vladislav (vedoucí práce) ; Petkevič, Vladimír (oponent)
This thesis presents the development of an MT system between Indonesian and Malaysian. The system uses a method of almost a direct translation exploiting the similarity of both languages. This method was previously used on a number of language pairs of European languages. The thesis also elaborates the attempts to make language resources from scratch since the languages are under-resourced.

Národní úložiště šedé literatury : Nalezeno 53 záznamů.   začátekpředchozí31 - 40dalšíkonec  přejít na záznam:
Chcete být upozorněni, pokud se objeví nové záznamy odpovídající tomuto dotazu?
Přihlásit se k odběru RSS.