keywords:"mfcc" - Výsledky hledání - Digitální repozitář

host :: přihlásit Digitální repozitář
		Hledej		Nový záznam		Nápověda		O repozitáři

Hlavní stránka > Výsledky hledání: keywords:"mfcc"

Hledej:

Tipy pro vyhledávaní :: Rozšířené hledání

Hledej ve sbírkách:

Seřadit podle:	Zobrazit výsledky:	Výstupní formát:

	Jednoduchý textově nezávislý hlasový zámek - Softwarový systém pro verifikaci mluvčích Kotulek, Milan ; Dolenský,, Jan (oponent) ; Staněk, Miroslav (vedoucí práce) V této diplomové práci jsou představeny různé formy biometriky a následně řešena problematika verifikace osob prostřednictvím hlasu. Nejprve je provedena analýza nahrávek řeči, vyhledání samohláskových úseků, ze kterých jsou následně získány spektrální charakteristiky pro jednotlivé samohlásky a mluvčí. Výsledkem této práce je vytvořená aplikace, disponující grafickým uživatelským prostředím, pro rozpoznání konkrétních mluvčí rozhodující se na základě získaných charakteristik z vytvořené databáze mluvčích. Vytvořená aplikace byla otestována, a dosažená úspěšnost korektního rozpoznání nabývá hodnoty přibližně 54 % pro krátké testovací nahrávky, a cca 88 % pro dlouhé záznamy řeči. Úplný záznam
	Robustní detekce klíčových slov v řečovém signálu Vrba, Václav ; Sysel, Petr (oponent) ; Atassi, Hicham (vedoucí práce) Diplomová práce je rozdělena do dvou částí teoretické a praktické. V teoretické části je zaměřena na metody analýzy a rozpoznání řečových signálů. V praktické části byl vytvořen systém pro rozpoznávání izolovaných slov v prostředí Matlab nezávislý na mluvčím zvlášť pro muže a ženy. Dále byly vytvořeny dvě řečové databáze pro využití v kokpitu a proběhlo testování a evaluace včetně vlivu přidaného šumu. Úplný záznam
	Rozpoznávání řeči s pomocí nástroje Sphinx-4 Kryške, Lukáš ; Uher, Václav (oponent) ; Burget, Radim (vedoucí práce) Tato diplomová práce se zabývá hledáním efektivní techniky pro strojové rozpoznávání řeči, konkrétně pak strojovým přepisem mluvené řeči do textu a následným hledáním klíčových slov. Toto řešení lze následně použit pro analýzy telefonních hovorů nebo jiné podobné aplikace. Celá diplomová práce se věnuje nástroji Sphinx-4 pro strojové rozpoznávání řeči, který využívá k popisu akustických modelů skrytých Markovových modelů (HMM – Hidden Markov Model). Práce detailně vysvětluje, jak takové modely připravit pro nový jazyk nebo dialekt jazyka a jak tyto modely softwarově implementovat v jazyce Java. Úplný záznam
	Určení výšky osob z řečového projevu Pelikán, Pavel ; Mekyska, Jiří (oponent) ; Atassi, Hicham (vedoucí práce) Diplomová práce se zaměřuje na určení výšky osob z řečové nahrávky. Nejprve je hodnocen současný stav řešení problému s odkazem na již vytvořené studie a získané poznatky jsou využity k vlastní práci. Byla vybrána studie, která se prezentuje nejlepšími výsledky určení výšky osob. Experimentální část této studie je v rámci diplomové práce rekonstruována. Dále je v rámci experimentální části této práce vytvořen vlastní systém pro odhad výšky řečníka z řečové nahrávky. Úspěšnost systému byla testována s využitím několika příznaků na nahrávkách z databáze TIMIT. Úplný záznam
	Rozpoznávání a klasifikace emocí na základě analýzy řeči Černý, Lukáš ; Atassi, Hicham (oponent) ; Smékal, Zdeněk (vedoucí práce) Diplomová práce se soustředí na klasifikaci emocí. Práce pojednává o parametrizaci zvukových souborů pomoci segmentálních a suprasegmentálních metod s ohledem na jejich další použití. Tato databáze obsahuje mnoho zvukových nahrávek s emocemi. Z těchto zvukových nahrávek jsou vytvořeny data, které jsou rozděleny do dvou částí. První část je použita pro trénik a druhá pro klasifikaci. Práce je soustředěna hlavně na samoorganizující sítě. Tato práce obsahuje programy v Matlabu, které mohou být použity pro parametrizaci jakékoliv databáze. Parametrizovaná data jsou předložena samoorganizující síťi ke klasifikaci. Dosažené výsledky jsou prezentovány na konci diplomové práce. Úplný záznam
	Analýza a rozpoznání logopedických vad v řečovém projevu Diviš, Jan ; Atassi, Hicham (oponent) ; Smékal, Zdeněk (vedoucí práce) Bakalářská práce se zabývá logopedickou vadou dyslalií a její charakteristikou. Dále je popsán proces vytváření a reprezentace řeči. V práci jsou představeny základy zpracování a analýzy řečového signálu ( LPC, kepstrální, MFCC). V programu MATLAB jsou provedena zobrazení charakteristik řeči a výpočty LPC, kepstrálních a melovských koeficientů. Práce je především zaměřena na nesprávné vyslovování hlásek "r" a "ř". Úplný záznam
	Dekodér pro systém detekce klíčových slov Krotký, Jan ; Míča, Ivan (oponent) ; Pfeifer, Václav (vedoucí práce) Práce seznamuje čtenáře se základními vlastnostmi rozpoznávání lidské řeči, popisuje systémy pro detekci klíčových slov a blíže se věnuje návrhu jednotlivých bloků dekodéru rozdělených do tří kapitol. První z nich popisuje operace, které jsou se signálem prováděny před rozdělením na rámce, i samotnou segmentaci. Druhá kapitola popisuje výpočet krátkodobé energie, počtu průchodů nulou a výpočet autokorelačních, predikčních a Melovských kepstrálních koeficientů. Třetí kapitola, která se zabývá návrhem bloku dekodéru, popisuje rozpoznávání pomocí metody dynamického borcení času a metody založené na skrytých Markovových modelech. V závěrečné části práce je popsán návrh dekodérů pracujících s plynulou řeči a návrh jednoduchého dekodéru pracujícího s izolovanými slovy, který je na základě předcházejících kapitol sestrojen a otestován. Úplný záznam
	Rozpoznání emočního stavu člověka z řeči Houdek, Miroslav ; Přinosil, Jiří (oponent) ; Atassi, Hicham (vedoucí práce) Tato diplomová práce pojednává o rozpoznání emočních stavů a určení pohlaví na základě analýzy řečového signálu. Pro popis řečového signálu jsme využili různých prozodických a kepstrálních příznaků. Součástí práce je popis neinvazivních metod pro odhad hlasivkových pulsů. Pro jednotlivé příznaky řeči jsme vytvořili funkce v programu MATLAB. Klasifikace byla provedena pomocí GMM klasifikátoru, který využívá Gaussova rozložení pravděpodobnosti pro modelování příznakového prostoru. Dále byl sestrojen systém pro rozpoznání emočních stavů mluvčího a systém pro rozpoznání pohlaví mluvčího z řeči. Úspěšnost vytvořených systémů jsme testovali s jednotlivými příznaky na různých délkách segmentů řečového signálu a výsledné procentuální úspěšnosti rozpoznávání porovnali. Závěrem jsme testovali vliv mluvčího a pohlaví na úspěšnost rozpoznání emočních stavů. Úplný záznam
	Počítačová analýza sportovních zápasů Židlík, Pavel ; Balík, Miroslav (oponent) ; Atassi, Hicham (vedoucí práce) Tato práce se zabývá možností rychlé analýzy fotbalového utkání z audio složky záznamu s možností využití některých metod také pro jiná než fotbalová utkání. Při úvodním zamyšlení bylo zaměřeno na detekci hvizdu píšťalky. Ten se ve spektru projevuje svým specifickým základním kmitočtem, který je mimo kmitočty běžné mluvy. Po odhadu harmonických kmitočtu, bylo zaměřeno na rozpoznání významu hvizdu. K této problematice bylo využito pana rozhodčího, který mne informoval o počtu druhů hvizdu a poskytl mi referenční vzorky pro klasifikaci hvizdu. Pro zjištění významu hvizdu bylo použito neuronové sítě s typem učení zpětné šíření. Dalším příznakem pro detekci významných okamžiků ze zápasu bylo zaměřeno na základní tón komentátora. V případě, že komentátor zápas prožívá naplno tak s každou významnou akcí, která se v zápase odehraje, se automaticky zvyšuje také jeho základní tón promluvy. Dalším příznakem, na který bylo zaměřeno, je detekce zvýšeného základního tónu komentátorova hlasu. Významným okamžikem v zápase jsou také národní hymny týmu, které proti sobě hrají. Dalším příznakem pro analýzu je tedy detekce hymny. Pro získání příznaku z audio signálu bylo využito výhod melovských kepstrálních koeficientů (MFCC) z nich bylo získáno 20 koeficientů. Tyto koeficienty byly použity jako vstup pro klasifikátor založený na neuronové sítí s typem učení zpětné šíření. Pro snadné použití těchto metod bylo vytvořeno grafické uživatelské rozhraní s možností přehledného náhledu získaných výsledků a také s možností přehrání vybraného úseku. Úplný záznam
	Rozpoznávání řeči (číslice) Kantar, Martin ; Minář, Petr (oponent) ; Matoušek, Radomil (vedoucí práce) V bakalářské práci vysvětluji, jak samotná řeč vypadá a co jí ovlivňuje. Zmiňuji zde nejčastěji používané metody, kterými si řečové signály můžeme připravit pro rozpoznávání. Na názorných příkladech ukazuji, na jakých principech dnešní rozpoznávače řeči pracují, jaké mají výhody a nevýhody. Pro metodu založenou na učení neuronových sítí jsem vytvořil v prostředí Matlabu řečový rozpoznávač číslovek 0-9. Úplný záznam

Chcete být upozorněni, pokud se objeví nové záznamy odpovídající tomuto dotazu?
Přihlásit se k odběru RSS.

Digitální repozitář :: :: :: ::
Powered by v1.1.2
Spravuje

Tato stránka je dostupná také v následujících jazycích:
Česky English