Národní úložiště šedé literatury Nalezeno 41 záznamů.  předchozí11 - 20dalšíkonec  přejít na záznam: Hledání trvalo 0.00 vteřin. 
Dekodér pro systém detekce klíčových slov
Krotký, Jan ; Míča, Ivan (oponent) ; Pfeifer, Václav (vedoucí práce)
Práce seznamuje čtenáře se základními vlastnostmi rozpoznávání lidské řeči, popisuje systémy pro detekci klíčových slov a blíže se věnuje návrhu jednotlivých bloků dekodéru rozdělených do tří kapitol. První z nich popisuje operace, které jsou se signálem prováděny před rozdělením na rámce, i samotnou segmentaci. Druhá kapitola popisuje výpočet krátkodobé energie, počtu průchodů nulou a výpočet autokorelačních, predikčních a Melovských kepstrálních koeficientů. Třetí kapitola, která se zabývá návrhem bloku dekodéru, popisuje rozpoznávání pomocí metody dynamického borcení času a metody založené na skrytých Markovových modelech. V závěrečné části práce je popsán návrh dekodérů pracujících s plynulou řeči a návrh jednoduchého dekodéru pracujícího s izolovanými slovy, který je na základě předcházejících kapitol sestrojen a otestován.
Jednoduchý textově nezávislý hlasový zámek - Softwarový systém pro verifikaci mluvčích
Kotulek, Milan ; Dolenský,, Jan (oponent) ; Staněk, Miroslav (vedoucí práce)
V této diplomové práci jsou představeny různé formy biometriky a následně řešena problematika verifikace osob prostřednictvím hlasu. Nejprve je provedena analýza nahrávek řeči, vyhledání samohláskových úseků, ze kterých jsou následně získány spektrální charakteristiky pro jednotlivé samohlásky a mluvčí. Výsledkem této práce je vytvořená aplikace, disponující grafickým uživatelským prostředím, pro rozpoznání konkrétních mluvčí rozhodující se na základě získaných charakteristik z vytvořené databáze mluvčích. Vytvořená aplikace byla otestována, a dosažená úspěšnost korektního rozpoznání nabývá hodnoty přibližně 54 % pro krátké testovací nahrávky, a cca 88 % pro dlouhé záznamy řeči.
Comparison of voice and audio codecs
Lúdik, Michal ; Sysel, Petr (oponent) ; Míča, Ivan (vedoucí práce)
This thesis deals with description of human hearing, audio and speech codecs, description of objective measure of quality and practical comparison of codecs. Chapter about audio codecs consists of description of lossless codec FLAC and lossy codecs MP3 and Ogg Vorbis. In chapter about speech codecs is description of linear predictive coding and G.729 and OPUS codecs. Evaluation of quality consists of description of segmental signal-to- noise ratio and perceptual evaluation of quality – WSS and PESQ. Last chapter deals with description od practical part of this thesis, that is comparison of memory and time consumption of audio codecs and perceptual evaluation of speech codecs quality.
Multimediální zpracování signálů
Staněk, Miroslav ; Pospíšil, Radek (oponent) ; Sigmund, Milan (vedoucí práce)
Diplomová práce se zabývá vytvořením vhodných multimediálních podkladů z oblasti signálů a soustav se spojitým časem. Pochopení této problematiky je velmi důležité, neboť povinný předmět Signály a soustavy, resp. BSIS, je vyučován na bakalářském stupni oboru EST. Porozumění vyučované látky je nezbytnou prerekvizitou v dalších předmětech k úspěšnému zvládnutí navazující látky. Další část diplomové práce je zaměřena na jednorozměrné diskrétní signály. Konkrétně si klade za cíl realizaci softwarového systému. Navržený systém disponuje jak základními operacemi (energie signálu, počet průchodů nulou atd.) se zvukovými soubory, tak i funkcemi složitějšími, mezi které se řadí např. vyhledávání samohlásek v plynulé řeči. Systém je rozdělen na dvě části. První program analyzuje právě zvukové soubory, vytváří nový zvukový soubor s hledanou samohláskou a soubory s potřebnými parametry pro další zpracování. Druhý program analyzuje získaná data, která následně statisticky vyhodnocuje. Výsledný systém může být užitečný pro identifikaci mluvčího, jeho emočního stavu atd.
Analýza Parkinsonovy nemoci pomocí segmentálních řečových příznaků
Mračko, Peter ; Mekyska, Jiří (oponent) ; Smékal, Zdeněk (vedoucí práce)
V tejto práci je popísaný návrh systému diagnózy Parkinsonovej choroby na základe reči. Parkinsonova choroba je neurodegeneratívna porucha centrálneho nervového systému, ktorej prejavom je okrem iných aj postihnutie motorických aspektov reči tzv. hypokinetická dysartria. Návrh systému je v tejto práci založený na najznámejších segmentálnych parametroch ako sú koeficienty LPC, PLP, MFCC, LPCC, ale aj menej známych ako sú CMS, ACW a MSC. Z rečových nahrávok pacientov postihnutých Parkinsonovou chorobou, ale aj kontrolných jedincov, sú vypočítané tieto koeficienty, ktoré sú v ďalšom postupe podrobené selekcii a následne klasifikácii. Najlepší výsledok, ktorý bol v práci získaný, dosahoval presnosť klasifikácie 77,19%, senzitivitu 74,69% a špecificitu 78,95%.
Srovnání spekter a směrových charakteristik dvouplátkových nástrojů
Cočev, Jiří ; Buzzi, Mario (oponent) ; Jirásek, Ondřej (vedoucí práce)
Bakalářská práce se věnuje analýze zvukových signálů dvouplátkových dechových hudebních nástrojů. Práce se dále zabývá podrobněji vlastnostem strojku a tomu, jak vlastnosti strojku ovlivní zvukový charakter nástroje. K popisu signálů bylo využito FFT, LPC, autokorelace a kepstrální analýzy. V závěru pak práce nabízí možnosti dalšího výzkumu dvouplátkových hudebních nástrojů.
Estimation of formant frequencies using machine learning
Káčerová, Erika ; Galáž, Zoltán (oponent) ; Mekyska, Jiří (vedoucí práce)
This Master's thesis deals with the issue of formant extraction. A system of scripts in Matlab interface is created to generate values of the first three formant frequencies from speech recordings with the use of Praat and Snack(WaveSurfer). Mel Frequency Cepstral Coefficients and Linear Predictive Coefficients are extracted from the audio files in order to be added to the database. This database is then used to train a neural network. Finally, the designed neural network is tested.
Codec Detection from Speech
Jon, Josef ; Matějka, Pavel (oponent) ; Černocký, Jan (vedoucí práce)
This thesis deals with codec detection from compressed speech signal. The primary goal was to identify which features distinguish selected codecs, and then create an environment facilitating experiments with various types of classifiers and their configurations. Support vector machines and neural networks, modeled using the Keras library, were used. The main contribution of this work is the experimental part, in which the effects of the neural networks parameters are discussed. After tuning the parameters and finding their optimal values, the network achieved accuracy over 98% on a test set comprising data from six different codecs.
Určení výšky osob z řečového projevu
Pelikán, Pavel ; Mekyska, Jiří (oponent) ; Atassi, Hicham (vedoucí práce)
Diplomová práce se zaměřuje na určení výšky osob z řečové nahrávky. Nejprve je hodnocen současný stav řešení problému s odkazem na již vytvořené studie a získané poznatky jsou využity k vlastní práci. Byla vybrána studie, která se prezentuje nejlepšími výsledky určení výšky osob. Experimentální část této studie je v rámci diplomové práce rekonstruována. Dále je v rámci experimentální části této práce vytvořen vlastní systém pro odhad výšky řečníka z řečové nahrávky. Úspěšnost systému byla testována s využitím několika příznaků na nahrávkách z databáze TIMIT.
Rozpoznání emočního stavu člověka z řeči
Houdek, Miroslav ; Přinosil, Jiří (oponent) ; Atassi, Hicham (vedoucí práce)
Tato diplomová práce pojednává o rozpoznání emočních stavů a určení pohlaví na základě analýzy řečového signálu. Pro popis řečového signálu jsme využili různých prozodických a kepstrálních příznaků. Součástí práce je popis neinvazivních metod pro odhad hlasivkových pulsů. Pro jednotlivé příznaky řeči jsme vytvořili funkce v programu MATLAB. Klasifikace byla provedena pomocí GMM klasifikátoru, který využívá Gaussova rozložení pravděpodobnosti pro modelování příznakového prostoru. Dále byl sestrojen systém pro rozpoznání emočních stavů mluvčího a systém pro rozpoznání pohlaví mluvčího z řeči. Úspěšnost vytvořených systémů jsme testovali s jednotlivými příznaky na různých délkách segmentů řečového signálu a výsledné procentuální úspěšnosti rozpoznávání porovnali. Závěrem jsme testovali vliv mluvčího a pohlaví na úspěšnost rozpoznání emočních stavů.

Národní úložiště šedé literatury : Nalezeno 41 záznamů.   předchozí11 - 20dalšíkonec  přejít na záznam:
Chcete být upozorněni, pokud se objeví nové záznamy odpovídající tomuto dotazu?
Přihlásit se k odběru RSS.