Národní úložiště šedé literatury Nalezeno 233 záznamů.  předchozí11 - 20dalšíkonec  přejít na záznam: Hledání trvalo 0.01 vteřin. 
Modelování jazyka v rozpoznávání češtiny
Mikolov, Tomáš ; Černocký, Jan (oponent) ; Smrž, Pavel (vedoucí práce)
Tato práce se zabývá problematikou jazykových modelů v oblasti automatického přepisu mluvené řeči. V teoretické části jsou rozebrány současně používané metody pro pokročilé jazykové modelování založené na statistickém přístupu - modely založené na třídách, na faktorech a na neuronových sítích. Následně je popsána implementace jazykového modelu založeného na dvou neuronových sítích. V závěru práce jsou uvedeny výsledky dosažené na Pražském a Brněnském mluveném korpusu (cca 1 170 000 slov) - redukce perplexity o zhruba 20%. Výsledky dosažené při reskórování N-best listů ukazují zlepšení při rozpoznávání spontánní řeči o více než 1%. V závěru práce jsou uvedeny možnosti využití práce, její možná rozšíření a také jsou uvedeny hlavní nevýhody současně používaných přístupů pro statistické jazykové modelování.
Zjednoznačňování slovních významů
Kraus, Michal ; Glembek, Ondřej (oponent) ; Smrž, Pavel (vedoucí práce)
Diplomová práce je zaměřena na rozpoznávání a zjednoznačňování českých slov.  Nejprve se čtenář seznámí s historickým kontextem úkolu, poté jsou mu předvedeny použité algoritmy: naivní Bayesův klasifikátor, klasifikátor AdaBoost, metoda maximální entropie a rozhodovací strom. Použité metody jsou názorně předvedeny na příkladu. V dalších částech práce jsou popsány datové sady a parametry pro klasifikaci. V závěrečné části práce dojde na zhodnocení výsledků a nastínění možných úprav.
Derivační morfologie češtiny na základě rozsáhlých korpusových dat
Faltusová, Marie ; Dytrych, Jaroslav (oponent) ; Smrž, Pavel (vedoucí práce)
Tématem této práce je zkoumání slovotvorby v českém jazyce. Hlavním cílem je vytvořit modul získávající derivace z dat elektronického Slovníku spisovné češtiny. Tato problematika byla vyřešena sestrojením tříúrovňového zpracování vycházejícího z dat slovníku. První úrovní je získání derivací z definic lemmat, druhým krokem je seskupení základních tvarů podle jejich podobností a třetí fází je ohodnocení získaných derivačních dvojic značkou derivační třídy, do které spadají. Zpracováním se podařilo získat více než 4 500 nových slov a ohodnotit nad 20 000 derivačních vazeb. Modul se stal plnohodnotnou součástí Morfologického analyzátoru Výzkumné skupiny znalostních technologií, působící na Fakultě informačních technologií Vysokého učení technického v Brně.
Intonation of Czech Speakers When Speaking English
Houšť, Vítězslav ; Baumgartnerová, Alena (oponent) ; Walek, Agata (vedoucí práce)
Intonation is frequently described as the movement of the pitch throughout a phrase, which assists the speaker in the vocal expression of their thoughts. The bachelor's thesis concerns the possible difficulties in intonation a Czech speaker may encounter when speaking English, as they can lead to a change of meaning of uttered words. The aim of the thesis is set to try and distinguish these difficulties by explaining the basic terms associated with intonation and their application on recordings of ten Czech speakers uttering eight English phrases, compared to recordings of the same eight phrases recorded by four native speakers.
Jednoduchý gramatický korektor pro češtinu do OpenOffice
Ličko, Jozef ; Herout, Adam (oponent) ; Smrž, Pavel (vedoucí práce)
Gramatika prirodzeného jazyka je komplexná a často ju nie je možné priamo, jednoznačne a formálne popísať. Existuje niekoľko prístupov, ako sa pokúsiť pomocou výpočtovej techniky o odhalenie a opravu gramatických chýb. Táto práca sa zaoberá vytvorením jednoduchého gramatického korektora, ktorý funguje na princípe pravidiel. Zameriava sa na neprítomnosť čiarok v súvetiach, v ktorých sa nachádzajú vedľajšie vety vzťažné. Keď takú časť vety korektor úspešne rozpozná, navrhne vhodné riešenie, ako je možné danú vetu opraviť. Aplikácia funguje ako prídavný modul do kancelárskeho balíka OpenOffice.
Automatické zařazování neznámých slov na základě derivačních vazeb
Faltusová, Marie ; Dytrych, Jaroslav (oponent) ; Smrž, Pavel (vedoucí práce)
Tato diplomová práce se zabývá vytvořením systému pro automatické zařazování neznámých slov na základě derivačních vazeb. Pro tento účel byl systém navržen tak, aby z~elektronických slovníkových dat získával derivační vazby a jejich rozborem z nich vytvářel slovotvorné modely. Na základě těchto znalostí je poté možné začleňovat nezařazená slova do stávajících hnízd, utvořených ze získaných vazeb, a jejich modelů, případně vytvářet nové. Čtenář bude postupně seznámen s důvody, které vedou k neustálé proměně či rozšiřování slovní zásoby, budou vysvětleny způsoby, jakými se odvozují slova v českém jazyce, a jak lze získat informace o změnách slov, vzniklých během derivačního procesu. Tento systém navazuje a rozšiřuje výzkum oblasti derivační morfologie v projektu morfologický analyzátor Výzkumné skupiny znalostních technologií, působící na Fakultě informačních technologií Vysokého učení technického v Brně.
Nalezení slovních kořenů v češtině
Hellebrand, David ; Bartík, Vladimír (oponent) ; Chmelař, Petr (vedoucí práce)
Cílem této diplomové práce je vytvořit pro český jazyk lemmatizační algoritmus založený na gramatických pravidlech. Práce obsahuje popis problematiky lemmatizace a několika různých lemmatizačních algoritmů. Dále jsou popsány základy gramatiky českého jazyka a také jazyka Snowball, ve kterém budou navržené postupy implementovány. Hlavní část tvoří popis implementace lemmatizačního algoritmu.
Zpracování češtiny v Pythonu
Novotný, Zdeněk ; Schmidt, Marek (oponent) ; Smrž, Pavel (vedoucí práce)
V této práci jsou představeny některé způsoby zpracování českého jazyka. První část obsahuje obecný popis systému NLTK. Některé později zmíněné funkce byly inspirovány funkcemi ze systému NLTK. Jsou zde popsány funkce zabývající se časováním a skloňováním slov různých slovních druhů v českém jazyce. Další část je zaměřena na zpracování textu v českém jazyce, v němž dochází k vyhledávání a označení jednotlivých vět a jiných částí. Poslední část popisuje možnost aplikace transformačních pravidel na části textu. Výsledek po aplikaci pravidel lze zobrazit graficky.
Fonetická transkripce českého jazyka
Pavel, Lukáš ; Křupka, Aleš (oponent) ; Sysel, Petr (vedoucí práce)
Cílem práce je vytvoření programu pro automatický přepis českého jazyka do fonetické podoby. První kapitola této práce se zabývá popisem základních fonetických jednotek, abeced a symbolů, které fonetické abecedy používají. Druhá kapitola podrobně popisuje pravidla fonetického přepisu českého jazyka, kde jsou uvedeny i konkrétní příklady. Nakonec ve třetí kapitole je popis vytvořeného programu v programovacím jazyce C, včetně vývojových diagramů pro lepší orientaci v jeho funkcích.
Jak se kde v Česku mluví aneb Co víme o dialektech češtiny
Ireinová, Martina ; Konečná, Hana
Přednáška se zabývá rozdílnými dialekty různé mluvy na Moravě a ve Slezsku.

Národní úložiště šedé literatury : Nalezeno 233 záznamů.   předchozí11 - 20dalšíkonec  přejít na záznam:
Chcete být upozorněni, pokud se objeví nové záznamy odpovídající tomuto dotazu?
Přihlásit se k odběru RSS.