Národní úložiště šedé literatury Nalezeno 3 záznamů.  Hledání trvalo 0.01 vteřin. 
Natural Language Correction With Focus on Czech
Náplava, Jakub ; Straka, Milan (vedoucí práce) ; Grundkiewicz, Roman (oponent) ; Dušek, Ondřej (oponent)
Automatická korekce textu (natural language correction) je obor zabývající se vytvá- řením systémů pro automatickou opravu lidmi psaných textů. Tento obor zahrnuje mimo jiné obecnou opravu gramatiky, opravu překlepů či doplnění diakritiky. V posledních le- tech jsme byli svědky velkého rozmachu tohoto oboru, objevily se nové modely pro korekci textu, datasety a také vyhodnocovací metriky. Tato disertace prezentuje formou souboru publikovaných prací naše příspěvky do této oblasti. Jelikož je čeština mateřským jazy- kem autora této práce, věnovali jsme velké úsilí zlepšování tohoto oboru v češtině. Mezi hlavní výstupy naší práce patří: (1) vytvoření velké datové sady pojmenované Grammar Error Correction Corpus for Czech, která obsahuje anotované texty psané různými typy uživatelů jako třeba eseje či příspěvky ve webových diskuzích, a zároveň natrénovaní a evaluaci automatických systémů založených na neuronových sítí a také provedení meta- evaluace automatických metrik, (2) vytvoření systémů pro automatickou korekci textu, které fungují dobře v situacích, kdy je k dispozici pouze malé množství anotovaných dat pro řízené učení a (3) vytvoření dvou systémů pro automatickou diakritizaci textu do- sahujících nejlepších známých výsledků a také vytvoření velké datové sady pro učení a vyhodnocování systémů pro...
Natural Language Correction
Náplava, Jakub ; Straka, Milan (vedoucí práce) ; Straňák, Pavel (oponent)
Cílem této diplomové práce je prozkoumat oblast automatické korekce pravopisu (jazyka) a navrhnout sadu modelů založených na neuronových sítí pro řešení úkolů počínaje opravou gramatiky až po diakritizaci. Diplomová práce začíná popisem postupů k jednotlivým problémům automatické korekce pravopisu. Dále jsou představeny již existující a dva nové datasety: dataset pro opravu gramatiky v češtině odvozený od datasetu CzeSL (Czech as a Second Language) a dataset s automaticky vytvořenými českými překlepy. Hlavní část této diplomové práce je věnována návrhu, implementaci a vyhodnocení tří navržených modelů na vybraných problémech automatické korekce pravopisu. Hlavní výhodou našich modelů v porovnání s existujícími statistickými systémy je fakt, že se vše dokáží naučit pouze z trénovacích dat. Naopak u současných statistických systémů musí být specifikován chybový model, model pro generování potencionálních oprav a mnohdy je také potřeba systém pro generování morfologických slovních druhů daného jazyka. Naše modely překonávají současné systémy na generování diakritizace. Při opravování překlepů a menších gramatických chyb je úspěšnost našich modelů lepší na 2 ze 3 datasetů. V gramatické korekci textu pak dosahujeme horších, i když stále srovnatelných, výsledků s nedávno nejlepším modelem.
PerfJavaDoc: extending API documentation with performance information
Náplava, Jakub ; Horký, Vojtěch (vedoucí práce) ; Hnětynka, Petr (oponent)
Javadoc je dokumentační nástroj určený pro automatické generování API dokumentace přímo ze zdrojových kódů programu. Takto vygenerovaná dokumentace může u některých metod obsahovat slovní popis použitého algoritmu a jeho asymptotické složitosti, ten je však nepoužitelný v situaci, kdy potřebujeme znát přesnou dobu běhu metody vzhledem k některým charakteristikám. V této práci jsme se rozhodli rozšířit Javadoc o automatické generování výkonnostní části, která vývojářům dovolí změřit výkonnost metody vůči některým předem definovaným vlastnostem. Tyto vlastnosti se specifikují v takzvaném generátoru zátěže, což je metoda, jejímž úkolem je připravit argumenty měřené metody společně s instancí třídy, na které je měřená metoda zavolána. Separace měřené metody od generátoru zátěže pak vývojářům umožňuje jednoduché a srozumitelné psaní a snadné sdílení generátorů. Samotné měření výkonnosti metody pak probíhá na měřícím serveru, který může běžet na určeném referenčním stroji, a byl naprogramován tak, aby poskytoval co nejpřesnější výsledky s ohledem na platformu Java. Powered by TCPDF (www.tcpdf.org)

Chcete být upozorněni, pokud se objeví nové záznamy odpovídající tomuto dotazu?
Přihlásit se k odběru RSS.