keywords:"MFCC" - Výsledky hledání - Digitální repozitář

host :: přihlásit Digitální repozitář
		Hledej		Nový záznam		Nápověda		O repozitáři

Hlavní stránka > Výsledky hledání: keywords:"MFCC"

Hledej:

Tipy pro vyhledávaní :: Rozšířené hledání

Hledej ve sbírkách:

Seřadit podle:	Zobrazit výsledky:	Výstupní formát:

	Rozpoznávání řeči s pomocí nástroje Sphinx-4 Kryške, Lukáš ; Uher, Václav (oponent) ; Burget, Radim (vedoucí práce) Tato diplomová práce se zabývá hledáním efektivní techniky pro strojové rozpoznávání řeči, konkrétně pak strojovým přepisem mluvené řeči do textu a následným hledáním klíčových slov. Toto řešení lze následně použit pro analýzy telefonních hovorů nebo jiné podobné aplikace. Celá diplomová práce se věnuje nástroji Sphinx-4 pro strojové rozpoznávání řeči, který využívá k popisu akustických modelů skrytých Markovových modelů (HMM – Hidden Markov Model). Práce detailně vysvětluje, jak takové modely připravit pro nový jazyk nebo dialekt jazyka a jak tyto modely softwarově implementovat v jazyce Java. Úplný záznam
	Počítačová analýza sportovních zápasů Židlík, Pavel ; Balík, Miroslav (oponent) ; Atassi, Hicham (vedoucí práce) Tato práce se zabývá možností rychlé analýzy fotbalového utkání z audio složky záznamu s možností využití některých metod také pro jiná než fotbalová utkání. Při úvodním zamyšlení bylo zaměřeno na detekci hvizdu píšťalky. Ten se ve spektru projevuje svým specifickým základním kmitočtem, který je mimo kmitočty běžné mluvy. Po odhadu harmonických kmitočtu, bylo zaměřeno na rozpoznání významu hvizdu. K této problematice bylo využito pana rozhodčího, který mne informoval o počtu druhů hvizdu a poskytl mi referenční vzorky pro klasifikaci hvizdu. Pro zjištění významu hvizdu bylo použito neuronové sítě s typem učení zpětné šíření. Dalším příznakem pro detekci významných okamžiků ze zápasu bylo zaměřeno na základní tón komentátora. V případě, že komentátor zápas prožívá naplno tak s každou významnou akcí, která se v zápase odehraje, se automaticky zvyšuje také jeho základní tón promluvy. Dalším příznakem, na který bylo zaměřeno, je detekce zvýšeného základního tónu komentátorova hlasu. Významným okamžikem v zápase jsou také národní hymny týmu, které proti sobě hrají. Dalším příznakem pro analýzu je tedy detekce hymny. Pro získání příznaku z audio signálu bylo využito výhod melovských kepstrálních koeficientů (MFCC) z nich bylo získáno 20 koeficientů. Tyto koeficienty byly použity jako vstup pro klasifikátor založený na neuronové sítí s typem učení zpětné šíření. Pro snadné použití těchto metod bylo vytvořeno grafické uživatelské rozhraní s možností přehledného náhledu získaných výsledků a také s možností přehrání vybraného úseku. Úplný záznam
	Dekodér pro systém detekce klíčových slov Krotký, Jan ; Míča, Ivan (oponent) ; Pfeifer, Václav (vedoucí práce) Práce seznamuje čtenáře se základními vlastnostmi rozpoznávání lidské řeči, popisuje systémy pro detekci klíčových slov a blíže se věnuje návrhu jednotlivých bloků dekodéru rozdělených do tří kapitol. První z nich popisuje operace, které jsou se signálem prováděny před rozdělením na rámce, i samotnou segmentaci. Druhá kapitola popisuje výpočet krátkodobé energie, počtu průchodů nulou a výpočet autokorelačních, predikčních a Melovských kepstrálních koeficientů. Třetí kapitola, která se zabývá návrhem bloku dekodéru, popisuje rozpoznávání pomocí metody dynamického borcení času a metody založené na skrytých Markovových modelech. V závěrečné části práce je popsán návrh dekodérů pracujících s plynulou řeči a návrh jednoduchého dekodéru pracujícího s izolovanými slovy, který je na základě předcházejících kapitol sestrojen a otestován. Úplný záznam
	Jednoduchý textově nezávislý hlasový zámek - Softwarový systém pro verifikaci mluvčích Kotulek, Milan ; Dolenský,, Jan (oponent) ; Staněk, Miroslav (vedoucí práce) V této diplomové práci jsou představeny různé formy biometriky a následně řešena problematika verifikace osob prostřednictvím hlasu. Nejprve je provedena analýza nahrávek řeči, vyhledání samohláskových úseků, ze kterých jsou následně získány spektrální charakteristiky pro jednotlivé samohlásky a mluvčí. Výsledkem této práce je vytvořená aplikace, disponující grafickým uživatelským prostředím, pro rozpoznání konkrétních mluvčí rozhodující se na základě získaných charakteristik z vytvořené databáze mluvčích. Vytvořená aplikace byla otestována, a dosažená úspěšnost korektního rozpoznání nabývá hodnoty přibližně 54 % pro krátké testovací nahrávky, a cca 88 % pro dlouhé záznamy řeči. Úplný záznam
	Analýza Parkinsonovy nemoci pomocí segmentálních řečových příznaků Mračko, Peter ; Mekyska, Jiří (oponent) ; Smékal, Zdeněk (vedoucí práce) V tejto práci je popísaný návrh systému diagnózy Parkinsonovej choroby na základe reči. Parkinsonova choroba je neurodegeneratívna porucha centrálneho nervového systému, ktorej prejavom je okrem iných aj postihnutie motorických aspektov reči tzv. hypokinetická dysartria. Návrh systému je v tejto práci založený na najznámejších segmentálnych parametroch ako sú koeficienty LPC, PLP, MFCC, LPCC, ale aj menej známych ako sú CMS, ACW a MSC. Z rečových nahrávok pacientov postihnutých Parkinsonovou chorobou, ale aj kontrolných jedincov, sú vypočítané tieto koeficienty, ktoré sú v ďalšom postupe podrobené selekcii a následne klasifikácii. Najlepší výsledok, ktorý bol v práci získaný, dosahoval presnosť klasifikácie 77,19%, senzitivitu 74,69% a špecificitu 78,95%. Úplný záznam
	Fixed-point implementace rozpoznávače řeči Král, Tomáš ; Černocký, Jan (oponent) ; Burget, Lukáš (vedoucí práce) Táto diplomová práca sa zaoberá problematikou automatického rozpoznávania reči na systémoch s obmedzenými hardwarovými prostriedkami - embedded systems. Cieľom projektu je navrhnúť a implementovať systém rozpoznávania reči na embedded systémy, ktoré nedisponujú floating-point výpočetnými jednotkami. V prvom rade bola zvolená vhodná hardwarová architektúra a s ohľadom na dostupné prostriedky, ktorými vybraná architektúra disponuje, bolo navrhnuté riešenie rozpoznávania reči. Jednotlivé časti systému rozpoznávania boli následne v priebehu vývoja optimalizované do takej podoby, aby mohli byť nasadené na zvolený HW. Výsledkom práce je dosiahnutie rozpoznávania českých čísloviek na embedded systéme. Úplný záznam
	Aplikace statistické analýzy řeči pacientů s Parkinsonovou nemocí Bijota, Jan ; Mžourek, Zdeněk (oponent) ; Galáž, Zoltán (vedoucí práce) Tato diplomová práce se zabývá zpracováním řečového signálu osob postižených Parkinsonovou nemocí za účelem vytvoření statistického vzorku řečových parametrů, pomocí něhož bude možno rozdělit zkoumané osoby na parkinsoniky a neparkinsoniky. Tento statistický vzorek je tvořen na základě detekce hypokinetické dysartrie u osob postižených Parkinsonovou nemocí. V práci je rozebíráno předzpracování řečového signálu pomocí metody ustřednění a preemfáze a jeho rozdělení na části (segmentace). Následně je popsáno parametrické vyjádření zpracovávaného vzorku pomocí fonačních parametrů, MFCC a PLP koeficientů. Dále jsou rozebírány možnosti statistické analýzy pomocí zmíněného parametrického vyjádření. V přípádě této práce statistická analýza sestává z výpočtu Pearsonova a Spearmanova korelačního koeficientu, vzájemné informace a parametrického Studentova t-testu a neparametrického Mann-Whitneyova U testu. Výsledkem práce je soubor řečových parametrů pro jednotlivé dlouhé české samohlásky, které dokáží dle provedené statistické analýzy nejlépe vyjádřit rozdíl mezi zdravým řečníkem a parkinsonikem. Tyto výsledky mohou napomoci při diagnóze osoby, u níž je podezření na Parkisonovu nemoc. Úplný záznam
	Estimation of formant frequencies using machine learning Káčerová, Erika ; Galáž, Zoltán (oponent) ; Mekyska, Jiří (vedoucí práce) This Master's thesis deals with the issue of formant extraction. A system of scripts in Matlab interface is created to generate values of the first three formant frequencies from speech recordings with the use of Praat and Snack(WaveSurfer). Mel Frequency Cepstral Coefficients and Linear Predictive Coefficients are extracted from the audio files in order to be added to the database. This database is then used to train a neural network. Finally, the designed neural network is tested. Úplný záznam
	Multiplatformní aplikace pro verifikaci mluvčího Görig, Jan ; Matějka, Pavel (oponent) ; Glembek, Ondřej (vedoucí práce) Bakalářská práce se zabývá rozpoznáváním mluvčího bez znalosti textu sdělení. Zmiňuje dnes používané způsoby extrakce příznaků a jejich vyhodnocení pomocí směsice Gaussových hustotních funkcí. Praktickým výstupem práce je aplikace pro vizualizaci průběhu rozpoznávání. Návrh aplikace je multiplatformní a využívá knihoven Qt a BSAPI. Úplný záznam
	Systém pro diarizaci mluvčích Bradáč, Josef ; Atassi, Hicham (oponent) ; Míča, Ivan (vedoucí práce) Systém pro diarizaci mluvčích má široké uplatnění na poli zpracování a analýzy řečových signálů. V této práci je rozebrán úvod do problematiky a následný postup pro navržení systému. Výsledkem práce je implementace samotného systému a jeho vyhodnocení na základě databáze nahrávek rozhovorů. Úplný záznam

Chcete být upozorněni, pokud se objeví nové záznamy odpovídající tomuto dotazu?
Přihlásit se k odběru RSS.

Digitální repozitář :: :: :: ::
Powered by v1.1.2
Spravuje

Tato stránka je dostupná také v následujících jazycích:
Česky English