Národní úložiště šedé literatury Nalezeno 19 záznamů.  1 - 10další  přejít na záznam: Hledání trvalo 0.01 vteřin. 
Návrh a implementace systému rozpoznávání druhů kobylek na základě jejich zvukových projevů
Schwarz, Jan ; Peterek, Nino (vedoucí práce) ; Hlaváčová, Jaroslava (oponent)
Ze strany biologů vzešel nápad na vytvoření systému na rozpoznávání druhů kobylek podle stridulací nahraných v terénu. V této práci se zabýváme rozlišením prozatím pěti druhů kobylek vyskytujících se na území České republiky za pomoci volně dostupného nástroje na rozpoznávání řeči HTK. Kromě samotného akustického modelu je součástí práce i internetové rozhraní, které pořízenou nahrávku vyhodnotí a výsledek zaznamená pro další zpracování. V současné fázi máme vytvořený model založený na omezeném počtu trénovacích nahrávek, který dává uspokojivé výsledky. Internetové rozhraní nicméně funguje i jako sběrný systém, tudíž cesta k rozšiřování a zlepšování modelu je otevřená.
Automatické osvojení vzorů s minimální supervizí
Klíč, Radoslav ; Hana, Jiří (vedoucí práce) ; Hlaváčová, Jaroslava (oponent)
Diplomová práce popisuje algoritmus pro automatické osvojení vzorů s minimální supervizí, který vznikl rozšířením systému Paramor (Monson, 2009), fungujícího zcela bez supervize. Systém je modifikován, aby přijímal snadno dostupná data ve formě ohýbaných slov s označenou hranicí morfémů jako dodatečný vstup. Součástí práce je také knihovna pro hierarchické shlukování, která umožňuje kombinaci různých zdrojů informací. Přístup byl testován na češtině, slovinštině, němčině a katalánštině a vykázal zvýšenou F-míru v porovnáni se základním Paramorem.
Vyhledávání v českých strukturovaných datech pomocí stemmingu
Tattermusch, Jan ; Hlaváčová, Jaroslava (vedoucí práce) ; Kuboň, Vladislav (oponent)
Tato práce implementuje a popisuje komponentu pro fulltextové vyhledávání s podporou eského doplování diakritiky a stemmingu. Doplňovač diakritiky pracuje na statistickém principu a zohleduje kontext. Práce obsahuje pět stemmerů připravených k okamžitému použití (dva algoritmické a tři hybridní), jejichž vlastnosti jsou diskutovány. Komponenta je vystavěna nad knihovnou Apache Lucene a poskytuje jednoduché rozhraní pro dotazování a přidávání, mazání a změnu indexovaných dokumentů. Ukládané dokumenty se skládají z pojmenovaných polí s de novanými datovými typy. Komponenta umožňuje de novat krom běžných fulltextových dotaz také netriviální dotazy s dopňujícími omezeními a ovlivnit vlastní zpasob výpočtu skóre výsledků dotazu. Výkon komponenty je dostatečný pro středně vytížené aplikace a orientační výkon je dle měření 50 dotazů za vteřinu nad úložištěm obsahujícím 2,7 milionu dokumenta. Přínos doplňování diakritiky a stemmingu pro kvalitu fulltextového vyhledávání byl měřen pomocí MAP a byl vyhodnocen jako významný.
Rozpoznávání číslovek v českém textu
Bureš, Jan ; Hlaváčová, Jaroslava (vedoucí práce) ; Štěpánek, Jan (oponent)
Účelem práce bylo sestrojit nástroj, který by byl schopen rozpoznávat základní číslovky v česky psaném textu, a to jak číslovky zapsané číslicemi, tak složené číslovky zapsané slovy. Důraz je kladen hlavně na rozpoznávání číslovek zapsaných pomocí slov a jejich korektní spojování do složených číslovek. Při rozpoznávání slovy zapsaných číslovek a jejich spojování jsou rozpoznávány a brány v potaz i hovorové, nespisovné či jinak nesprávné, ale přesto používané tvary či spojení. Výstupem je pak pro každou číslovku její hodnota zapsaná pomocí číslic a množina možných morfologických značek. Program sám provádí lexikální i gramatickou analýzu na základě souboru tvarů slov a pravidel, která jsou mu poskytnuta.
Český morfologický guesser
Suchánek, Michal ; Hlaváčová, Jaroslava (vedoucí práce) ; Mírovský, Jiří (oponent)
C ílem práace je implementace guesseru pro českýy jazyk, kter ý využívá slovní kov á data. První m krokem při analýze textu je p ři řazení morfologick ých tag ů jednotlivým slov ům v textu. Morfologick é tagy popisují slovní druh a tvar slova, co ž je informace pot řebn á pro další anal ýzu textu. Morfologick é tagy se přiřazují na základě automatick ého vyhledání pří slu šného slovn í ho tvaru ve slovní ku. Morfologický guesser přiřazuje tagy slovům, která ve slovn í ku nebyla nalezena. Zde popsan ý guesser využí v á podobnost nerozpoznan ých slov se slovy již ve slovní ku obsa ženými.
Systém českých číslovek a jejich automatické rozpoznání v textu
Bureš, Jan ; Hlaváčová, Jaroslava (vedoucí práce) ; Mírovský, Jiří (oponent)
Diplomová práce má dva cíle. Prvním je systematické roztřídění českých číslovek a dalších (i víceslovných) kvantitativních výrazů s ohledem na možné využití pro automatické zpracování češtiny. Základem jsou stávající mluvnice češtiny a vlastní vyhledávání v českých jazykových korpusech. Druhým cílem je pak vytvoření programu na rozpoznávání číslovek v českém textu a jejich určení podle systému navrženého v části 1. Součástí programu je i určení morfologických vlastností číslovek, především jejich základního tvaru, rodu, čísla a pádu. U číslovek vyjadřujících konkrétní číslo, pokud nejsou zapsané číslicemi, pak program umí takový zápis vygenerovat, přičemž je počítáno i s tím, že pravidla pro správné zapsání číslovek nejsou často dodržována, takže nelze spoléhat na kodifikovaný pravopis.
České předpony
Hrušecký, Michal ; Hlaváčová, Jaroslava (vedoucí práce) ; Mírovský, Jiří (oponent)
V předložené práci je popsáno, jakým způsobem lze automaticky odhalovat v českém jazyce nově vznikající předpony. Je zde zmíněno několik různých metod pro jejich automatické rozpoznávání a jedna z nich je podrobněji rozebrána. Součástí práce je i ukázková implementace. Ta je k dispozici včetně zdrojových kódů a programátorské dokumentace na přiloženém CD. Na CD jsou přiložena i použitá testovací data a kompletní výsledky všech testů zmiňovaných v textu práce.
Splitting word compounds
Oberländer, Jonathan ; Pecina, Pavel (vedoucí práce) ; Hlaváčová, Jaroslava (oponent)
Jazyky, jako je němčina, holandština, skandinávské jazyky nebo řečtina, na rozdíl od angličtiny netvoří kompozita jako víceslovné výrazy, ale spojením jednotlivých částí do nového slova bez ortografického oddělení. To představuje problém pro řadu úloh zpracování přirozeného jazyka, jako je například statistický strojový překlad či vyhledávání informací. Většina předešlých prací na téma rozkladu složenin na jejich částí se zaměřovala na němčinu. V této práci jsme vyvinuli nový jednoduchý systém založený na nařízeném strojovém učení pro automatický rozklad složenin pro tři reprezentativní kompozitní jazyky: němčina, švédština a maďarština. Součástí práce je vytvoření multilinguální evaluační datové sady z lékařské domény anotováním složenin získaných z korpusu EMEA a vyhodnocení několika variant našeho systému a srovnání s předchozími přístupy. Powered by TCPDF (www.tcpdf.org)
Extending the Lexical Network DeriNet
Vidra, Jonáš ; Žabokrtský, Zdeněk (vedoucí práce) ; Hlaváčová, Jaroslava (oponent)
DeriNet je databáze českých lexikálních derivátů - lexikální síť, ve které uzly odpovídají lemmatům vybraným z Českého národního korpusu a hrany derivačním vztahům mezi nimi (například práce → pracovat → vypracovat). Vybírání lemmat z korpusu s sebou nese dva hlavní problémy: chybovost a chybějící lemmata, která by mohla sloužit jako spojnice mezi dosud nespojenými komponentami slovní sítě. Proto je potřeba najít spolehlivější a bohatší zdroj lemmat. Cílem této práce je rozšířit slovní zásobu DeriNetu pomocí lemmat z českého morfologického slovníku MorfFlex CZ a opravit derivační pravidla, která s novými slovy produkují chyby. Chybovost je měřena porovnáváním vztahů v databázi s ručně anotovanými daty vytvořenými v rámci práce. Powered by TCPDF (www.tcpdf.org)
Návrh a implementace systému rozpoznávání druhů kobylek na základě jejich zvukových projevů
Schwarz, Jan ; Peterek, Nino (vedoucí práce) ; Hlaváčová, Jaroslava (oponent)
Ze strany biologů vzešel nápad na vytvoření systému na rozpoznávání druhů kobylek podle stridulací nahraných v terénu. V této práci se zabýváme rozlišením prozatím pěti druhů kobylek vyskytujících se na území České republiky za pomoci volně dostupného nástroje na rozpoznávání řeči HTK. Kromě samotného akustického modelu je součástí práce i internetové rozhraní, které pořízenou nahrávku vyhodnotí a výsledek zaznamená pro další zpracování. V současné fázi máme vytvořený model založený na omezeném počtu trénovacích nahrávek, který dává uspokojivé výsledky. Internetové rozhraní nicméně funguje i jako sběrný systém, tudíž cesta k rozšiřování a zlepšování modelu je otevřená.

Národní úložiště šedé literatury : Nalezeno 19 záznamů.   1 - 10další  přejít na záznam:
Viz též: podobná jména autorů
16 Hlaváčová, Jana
3 Hlaváčová, Jitka
1 Hlaváčová, Josefína
1 Hlaváčová, Julie
Chcete být upozorněni, pokud se objeví nové záznamy odpovídající tomuto dotazu?
Přihlásit se k odběru RSS.