Národní úložiště šedé literatury Nalezeno 95 záznamů.  začátekpředchozí86 - 95  přejít na záznam: Hledání trvalo 0.01 vteřin. 
Rozpoznávač řeči s omezeným slovníkem
Vystavěl, Kamil ; Míča, Ivan (oponent) ; Sysel, Petr (vedoucí práce)
Bakalářská práce se zabývá implementací metody rozpoznávání řeči s omezeným počtem rozpoznávaných slov v prostředí Matlab. Rozpoznávač je založen na metodě dynamického programování realizované algoritmem borcení časové osy (DTW) a je určen pro rozpoznávání izolovaných slov. Z řečového signálu jsou vyčíslovány příznaky pomocí metod krátkodobé analýzy signálu v časové a kmitočtové oblasti, dále pomocí metod na principu kepstrální analýzy a lineární prediktivní analýzy signálu. Příznaky vytvoří obraz slova vhodný pro kvantifikaci míry podobnosti s obrazem jiného slova. Algoritmus borcení časové osy eliminuje vliv kolísání tempa promluvy nelineární normalizací časové osy jednoho ze slov tak, aby se obrazy slov co nejvíce shodovaly. Míra podobnosti dvou slov je vyčíslena jako vzdálenost slov. Ve slovníku rozpoznávače jsou uloženy obrazy známých slov, obraz neznámého slova je porovnán s obrazy slov ve slovníku a jsou vyčísleny vzdálenosti každého známého slova s neznámým slovem. Neznámé slovo je určeno jako shodné s tím slovem ve slovníku, ke kterému má nejmenší vzdálenost. Úspěšnost klasifikace je závislá především na volbě příznaků.
Online detekce jednoduchých příkazů v audiosignálu
Zezula, Miroslav ; Březina, Lukáš (oponent) ; Krejsa, Jiří (vedoucí práce)
Tato práce popisuje vývoj hlasového modulu, který je schopen rozpoznávat jednoduché řečové povely na základě porovnání zvukového vstupu s uloženými vzory. První část práce obsahuje popis použitého algoritmu a ověření jeho funkčnosti. Algoritmus je založen na Mel-frekvenčních cepstrálních koeficientech a dynamickém borcení času. Dále je navržen hardware hlasového modulu, obsahující signálový kontrolér 56F805 firmy Freescale. Signál z mikrofonu je upraven operačními zesilovači a digitálním filtrem. Třetí část se zabývá vývojem software pro kontrolér a popisuje implementaci algoritmu v pevné řádové čárce s ohledem na omezené možnosti kontroléru. Závěrečná zkouška prokazuje použitelnost modulu v prostředí s nízkým obsahem šumu.
Voice Sample database design for speech recognition purposes
Grobelný, Petr ; Malý, Jan (oponent) ; Pfeifer, Václav (vedoucí práce)
This thesis deals with problems of speech recognition and creation of speech corpus, which will serve as a training or testing data for speech recognition system. Mentioned corpus is designed as a corpus of read speech. In theoretical part reader is acquainted with the term Speech Recognition and then is more deeply introduced to the problems. The practical part consists of a detailed description of read speech database creation. The very corpus is then presented on the attached data carrier. In the last part there is a documentation of the read speech corpus presented.
Rozpoznávání řeči s pomocí nástroje Sphinx-4
Kryške, Lukáš ; Uher, Václav (oponent) ; Burget, Radim (vedoucí práce)
Tato diplomová práce se zabývá hledáním efektivní techniky pro strojové rozpoznávání řeči, konkrétně pak strojovým přepisem mluvené řeči do textu a následným hledáním klíčových slov. Toto řešení lze následně použit pro analýzy telefonních hovorů nebo jiné podobné aplikace. Celá diplomová práce se věnuje nástroji Sphinx-4 pro strojové rozpoznávání řeči, který využívá k popisu akustických modelů skrytých Markovových modelů (HMM – Hidden Markov Model). Práce detailně vysvětluje, jak takové modely připravit pro nový jazyk nebo dialekt jazyka a jak tyto modely softwarově implementovat v jazyce Java.
Dekodér pro systém detekce klíčových slov
Krotký, Jan ; Míča, Ivan (oponent) ; Pfeifer, Václav (vedoucí práce)
Práce seznamuje čtenáře se základními vlastnostmi rozpoznávání lidské řeči, popisuje systémy pro detekci klíčových slov a blíže se věnuje návrhu jednotlivých bloků dekodéru rozdělených do tří kapitol. První z nich popisuje operace, které jsou se signálem prováděny před rozdělením na rámce, i samotnou segmentaci. Druhá kapitola popisuje výpočet krátkodobé energie, počtu průchodů nulou a výpočet autokorelačních, predikčních a Melovských kepstrálních koeficientů. Třetí kapitola, která se zabývá návrhem bloku dekodéru, popisuje rozpoznávání pomocí metody dynamického borcení času a metody založené na skrytých Markovových modelech. V závěrečné části práce je popsán návrh dekodérů pracujících s plynulou řeči a návrh jednoduchého dekodéru pracujícího s izolovanými slovy, který je na základě předcházejících kapitol sestrojen a otestován.
Rozpoznáváni standardních PILOT-CONTROLLER řídicích povelů v hlasové podobě
Kufa, Tomáš ; Polách, Petr (oponent) ; Honzík, Petr (vedoucí práce)
Obsahem této práce je aplikace rozpoznávání řeči na ATC povely. Volba metod a přístupů k automatickému rozpoznávání ATC povelů vychází z podrobné studie letového provozu. Protože neexistuje jednoznačné řešení, zvlášť v tak obsáhlém oboru jako je rozpoznávaní řeči, je v této práci realizován rozpoznávač založený na porovnávání se vzory (DTW) a je srovnán s volně dostupným systémem HTK z University v Camridge založeném na statistických metodách využívajících skryté Markovovy modely. Míra vhodnosti obou metod je podložena praktickým testováním a vyhodnocením výsledku.
Detekce chybné výslovnosti v mluvené řeči
Struhař, Michal ; Rajmic, Pavel (oponent) ; Sysel, Petr (vedoucí práce)
Práce se zabývá problematikou detekce chybné výslovnosti v mluvené řeči. Jedním z cílů této práce je výběr vhodných parametrizací. Jedná se o krátkodobou energii, funkci středního počtu průchodu signálu nulou, lineární prediktivní analýzu, perceptivní lineární prediktivní analýzu, metodu RASTA, kepstrální analýzu a melovské kepstrální koeficienty. Dalším cílem je konstrukce detektoru chybné výslovnosti na bázi DTW (dynamické borcení času) a umělé neuronové sítě. Samotná detekce probíhá na základě získaných příznaků z vybraných analýz a fonetického přepisu promluvy. Parametrizace, detektor i fonetická transkripce českého jazyka jsou implemetovány v simulačním prostředí MATLAB.
Rozpoznávání řeči (číslice)
Kantar, Martin ; Minář, Petr (oponent) ; Matoušek, Radomil (vedoucí práce)
V bakalářské práci vysvětluji, jak samotná řeč vypadá a co jí ovlivňuje. Zmiňuji zde nejčastěji používané metody, kterými si řečové signály můžeme připravit pro rozpoznávání. Na názorných příkladech ukazuji, na jakých principech dnešní rozpoznávače řeči pracují, jaké mají výhody a nevýhody. Pro metodu založenou na učení neuronových sítí jsem vytvořil v prostředí Matlabu řečový rozpoznávač číslovek 0-9.
Formy zadávání a zpracování textových dat a informací v podnikových IS - trendy a aktuální praxe
Válková, Jana ; Stanovská, Iva (vedoucí práce) ; Hais, Petr (oponent)
Tato práce seznamuje čtenáře se základními druhy zadávání a zpracování textových dat a informací včetně jejich historického kontextu i výhledu do budoucnosti a předkládá aktuální trendy mezi technologiemi vstupu dat do počítače, které jsou konfrontovány s praxí. První část práce tvoří souhrn informací o jednotlivých formách zadávání a zpracování textových dat a informací, následně jsou představeny technologické trendy na trhu se zaměřením na systémy automatického rozpoznávání řeči spolu s možnostmi jejich uplatnění v podnikové sféře, včetně praktických zkušeností s některými z nich. Závěr této práce tvoří průzkum mezi českými IT podniky, na jehož základě bylo navrženo, jaké technologie by měly být využity jako součást informačních systémů.
Použití RLPC inventářů systému Festival v Eposu
Chaloupka, Zdeněk ; Horák, Petr
Cílem tohoto příspěvku je popsat možnosti implementace nových hlasů do text-to-speech (TTS) systému Epos. Pro implementaci jsme použili inventáře TTS systému Festival. Inventáře obsahují komprimované řečové jednotky v podobě koeficientů Residuálně Lineárního Predikčního Kódování (RLPC) a další nutné informace pro syntézu řeči. Text je předáván systému Epos v MBROLA formátu a je tedy možné přímo určovat délku hlásek i tvar prosodie.

Národní úložiště šedé literatury : Nalezeno 95 záznamů.   začátekpředchozí86 - 95  přejít na záznam:
Chcete být upozorněni, pokud se objeví nové záznamy odpovídající tomuto dotazu?
Přihlásit se k odběru RSS.