Národní úložiště šedé literatury Nalezeno 53 záznamů.  1 - 10dalšíkonec  přejít na záznam: Hledání trvalo 0.00 vteřin. 
Iterativní zdokonalování přepisu zvukových nahrávek s využitím zpětné vazby posluchačů
Krůza, Jan Oldřich ; Kuboň, Vladislav (vedoucí práce) ; Pollák, Petr (oponent) ; Müller, Luděk (oponent)
Iterativní zdokonalování přepisu zvukových nahrávek s využitím zpětné vazby posluchačů Abstrakt Tato disertační práce se zabývá zpřístupněním zvukových záznamů jednoho mluv- čího úzké i široké veřejnosti. Motivací práce byla existence chátrajících nahrávek hovorů českého filozofa ing. Karla Makoně na kazetách a kotoučích. Cílem je zachování materiálu pro bu- doucí generace a zpřístupnění nahrávek pomocí digitálních technologií, především přístupnosti nahrávek na internetu a možnosti vyhledávání v nich. Práce představuje tvorbu systému pro přepis velké sady zvukových záznamů se zapojením laické komunity. Navržené řešení spočívá ve vytvoření základního přepisu nízké kvality pomocí automatického rozpoznávání řeči a vyvinutí aplikace, která umožní od členů komunity i nahodilých zájemců získávat opravy automa- tického přepisu, použitelné jako trénovací data pro další zlepšování. Popíše se samotný mluvený korpus. Představí se autor a jeho dílo, témata v nahrávkách, nahrávání samotné, digitalizace a získané přepisy. Dále se rozvede tvorba systému pro automatický přepis korpusu od sběru dat přes akustické a jazykové modelování, různé provedené experimenty až k vyhodnocení úspěšnosti. V neposlední řadě se popíše webová aplikace pro sběr manuálních přepisů. Zmíní se odlišnosti od ostatních systémů, detaily návrhu a...
Automatic Checking of Translation
Šimlovič, Juraj ; Kuboň, Vladislav (vedoucí práce) ; Dědek, Jan (oponent)
Prekladové pamäte sa stávajú u profesionálnych prekladateľov čím ďalej, tým viac populárne; a to predovšetkým v oblasti lokalizácie produktov a pri preklade odborných či oficiálnych dokumentov. Aj keď komerčné systémy pracujúce s prekladovými pamäťami ponúkajú limitované možnosti automatickej kontroly prekladu, obvykle sa jedná iba o jednoduché nástroje vyhľadávania v texte. Navyše žiaden z týchto systémov neponúka adekvátne možnosti zapojiť do kontroly morfológiu. Profesionálny prekladatelia by ocenili automatizovaný nástroj, ktorý by ponúkal možnosti kontroly prekladu na základe pokročilejších pravidiel, a ktorý by vzal v úvahu českú, ale i anglickú morfológiu. Užitočná by bola nielen kontrola použitia správnej terminológie, ale taktiež kontrola použitia zakázaných kombinácií slov. Táto práca skúma typy chýb, ktoré prekladatelia zvyknú robiť a ponúka prehľad existujúcich riešení automatickej kontroly prekladu pre iné jazyky. Následne navrhuje a implementuje aplikáciu, ktorá sa pokúša hľadať niektoré z najčastejších chýb pri preklade do češtiny, vnášajúc morfológiu do vyhľadávacieho procesu.
Automatické zjednodušování textů pro překlad
Prokopová, Magdalena ; Kuboň, Vladislav (vedoucí práce) ; Zeman, Daniel (oponent)
Tato práce se zabývá využitím automatického zjednodušování (simplifi akce) textů pro účely automatického překladu. Práce srovnává automatické zjednodušování a kotrolované psaní, co mají společného a jaké jsou jejich rozdíly. Dále se zaměřuje na zjednodušování v souvislosti s automatickým překladem. Je popsáno jaké problémy může zjednodušování vyřešit a pro část z nich je řešení navrženo. V rámci práce byl implementován systém ASOFT, který provádí vybrané transformace na větách. Výsledky systému ASOFT ve spojení se systémem automatického překladu PC Transaltor byly vyhodnoceny pomocí několika metrik, zvolili jsem automatické vyhodnocení pomocí BLEU a NIST a vyhodnocení provedené lidskými anotátory. V závěru nastiňujeme jakými dalšími způsoby by se dané téma mohlo rozvíjet.
Vyhledávání v českých strukturovaných datech pomocí stemmingu
Tattermusch, Jan ; Hlaváčová, Jaroslava (vedoucí práce) ; Kuboň, Vladislav (oponent)
Tato práce implementuje a popisuje komponentu pro fulltextové vyhledávání s podporou eského doplování diakritiky a stemmingu. Doplňovač diakritiky pracuje na statistickém principu a zohleduje kontext. Práce obsahuje pět stemmerů připravených k okamžitému použití (dva algoritmické a tři hybridní), jejichž vlastnosti jsou diskutovány. Komponenta je vystavěna nad knihovnou Apache Lucene a poskytuje jednoduché rozhraní pro dotazování a přidávání, mazání a změnu indexovaných dokumentů. Ukládané dokumenty se skládají z pojmenovaných polí s de novanými datovými typy. Komponenta umožňuje de novat krom běžných fulltextových dotaz také netriviální dotazy s dopňujícími omezeními a ovlivnit vlastní zpasob výpočtu skóre výsledků dotazu. Výkon komponenty je dostatečný pro středně vytížené aplikace a orientační výkon je dle měření 50 dotazů za vteřinu nad úložištěm obsahujícím 2,7 milionu dokumenta. Přínos doplňování diakritiky a stemmingu pro kvalitu fulltextového vyhledávání byl měřen pomocí MAP a byl vyhodnocen jako významný.
Segmentační analýza českých vět
Procházka, Jan ; Kuboň, Vladislav (vedoucí práce) ; Holan, Tomáš (oponent)
Cílem této práce je implementace segmentační analýzy českého jazyka včetně vytvoření seznamu separátorů. Kromě toho je zde navržena a implementována metoda rozdělení do klauzí. Implementace využívá český morfologický analyzátor prof. Hajiče. Samotný program je napsán v Pythonu. Metoda byla odladěna na korpusu 62 vět a otestována na korpusu velikosti 80 vět.
Lokalizace softwaru a překladatelské nástroje. Případová studie: Mozilla Firefox v2.0
Dolejš, Jan ; Nemejovský, Jan (vedoucí práce) ; Kuboň, Vladislav (oponent)
Lokalizace softwaru představuje jeden z nejdynamičtěji rostoucích specializovaných sektorů poslední doby. Rozmach této oblasti umožnilo zejména masivní rozšíření výpočetní techniky v 90. letech 20. století, následné zavádění standardů IT a rozvíjení infrastruktury celosvětové internetové sítě. Znalost kulturních specifik využívají k průniku na jednotlivé národní trhy globálně působící společnosti, potřeba komunikace v mateřském jazyce ovšem vychází rovněž od samotných koncových uživatelů výpočetní techniky. V diplomové práci se věnuji nástinu historie lokalizačního odvětví, činnosti a vlivu standardizačních institucí na jeho další směrování a obecně uznávaným zásadám lokalizace softwarových aplikací. Uvádím možnosti využití technologických nástrojů pro lokalizaci uživatelského rozhraní z pohledu překladatele a zabývám se lokalizací programového vybavení s otevřeným zdrojovým kódem. Součást práce tvoří případová studie lokalizace webového prohlížeče do češtiny, glosář termínů a tematické přílohy
Porovnáni metod česko-ruského automatického překladu
Bílek, Karel ; Kuboň, Vladislav (vedoucí práce) ; Bojar, Ondřej (oponent)
V této práci představuji několik metod česko-ruského automatického pře- kladu, včetně jak více historických, tak více moderních systémů, a včetně jak frá- zových, tak pravidlových systémů. Nejdříve stručně popisuji lingvistické základy češtiny a ruštiny a jejich společnou historii a rozdíly. Poté popisuji automatizaci, vytváření a zlepšování některých ze systémů automatického překladu, společně s je- jich porovnáním, s použitím jak automatických metrik, tak omezené lidské anotace. Zároveň s tím také popisuji vytvoření několika korpusů česko-ruských paralelních dat a ruských monolingválních dat.
Methods for Creating Subjectivity Lexicon for Indonesian
Franky, ; Bojar, Ondřej (vedoucí práce) ; Kuboň, Vladislav (oponent)
Cílem naší práce byla tvorba slovníků subjektivity pro indonéštinu překladem již existujících anglických slovníků a jejich následnou kombinací průnikem a sjed- nocením. Porovnali jsme efektivnost výsledných slovníků pomocí jednoduché prediktivní metody, která měří a porovnává počet výskytů kladných a záporných výrazů ve větě. Použili jsme také dvě různé hodnotící funkce založené jak na četnosti tak na relativní četnosti výrazů v neanotovaných datech. Úpravou predik- tivní metody využívající strojového učení jsme posléze lépe začlenili údaje, které nemohly být zachyceny jednoduchou predikcí. Dále jsme ukázali, že slovníky byly v predikci na testovacích větách schopny dosáhnout vysokého pokrytí ale nízké přesnosti. Ohodnocování výrazů dokáže zlepšit pokrytí či přesnost, ovšem však vždy i se srovnatelným poklesem v druhé metrice. Predikce na bázi stro- jového učení byla schopna minimalizovat citlivost výkonu na velikosti slovníku, bude však zapotřebí dalších experimentů, aby se nalezla nejlepší volba prediktivní metody. 1
Využití lingvistických informací při EBMT
Týnovský, Miroslav ; Kuboň, Vladislav (vedoucí práce) ; Žabokrtský, Zdeněk (oponent)
Metoda strojového překladu založená na příkladech (EBMT) je korpusová metoda strojového překladu, která se pokouší získat překlad vstupního textu pomocí analogie s překladem textu podobného již hotového. Tato práce zkoumá význam využití lingvistické informace v této metodě překladu, a to konkrétně na dvou jazykových párech: čeština-angličtina a čeština-němčina. Zahrnuje shromáždění anotovaných paralelních dat pro jazykový pár čeština-němčina, návrh experimentálního EBMT systému, jeho implementaci a vylepšování jeho části s použitím lingvistických informací. Práce také obsahuje podrobné vyhodnocení jak výchozího systému, tak systému využívajícího informace o morfologii a syntaxi a jejich porovnání. Vyhodnocení systému bylo provedeno jednak automatickými metodami BLEU, NIST a METEOR a jednak ručně za pomoci anotátorů. Lingvistické informace aplikované na experimentální EBMT systém zahrnují morfologické a syntaktické porovnávání vstupní věty s příklady v překladové paměti.

Národní úložiště šedé literatury : Nalezeno 53 záznamů.   1 - 10dalšíkonec  přejít na záznam:
Chcete být upozorněni, pokud se objeví nové záznamy odpovídající tomuto dotazu?
Přihlásit se k odběru RSS.