Národní úložiště šedé literatury Nalezeno 4 záznamů.  Hledání trvalo 0.00 vteřin. 
Detekce lidské řeči v audio nahrávce
Břenek, Roman ; Grézl, František (oponent) ; Matějka, Pavel (vedoucí práce)
Tato práce se zabývá technikami detekce lidské řeči v nahrávkách. Je nutné při rozpoznávání správně klasifikovat všechny neřečové segmenty a naopak rozpoznat veškerou řeč i v hlučných a zašuměných prostředích. V práci je popsán celý proces rozpoznávání, tzn. digitalizace audio signálu, extrakce příznaků, trénování klasifikátoru, rozpoznávání a samotné vyhodnocení a úpravy před vyhodnocením. Pro rozpoznávání byly použity tři systémy, z nichž jeden je založen na fonémovém rozpoznávání pomocí neuronových sítí, další dva jsou založené na GMM, přičemž každý systém byl testován na třech datových sadách - Tactical Speaker Identification Speech Corpus (TSID), Ham Radio (HR) a Rich Transcription Evaluation (RT05-RT07).  Nejlepší výsledky každého systému jsou pak zhodnoceny i s výsledky třetích stran.
Voice Conversion
Lukáč, Peter ; Glembek, Ondřej (oponent) ; Černocký, Jan (vedoucí práce)
The matter of this thesis is voice conversion. Voice conversion is taking speech of one speaker, that we call source speaker and transforming it into speech that sounds as the speech of another speaker, that we call target speaker. This is accomplished using voice conversion system described in this thesis. As the framework for speech analysis and synthesis, we are using tool called STRAIGHT that was predominantly used in Voice Conversion Challenge 2016. Our voice conversion system is based on spectral conversion using feed-forward neural network and parallel training.
Voice Conversion
Lukáč, Peter ; Glembek, Ondřej (oponent) ; Černocký, Jan (vedoucí práce)
The matter of this thesis is voice conversion. Voice conversion is taking speech of one speaker, that we call source speaker and transforming it into speech that sounds as the speech of another speaker, that we call target speaker. This is accomplished using voice conversion system described in this thesis. As the framework for speech analysis and synthesis, we are using tool called STRAIGHT that was predominantly used in Voice Conversion Challenge 2016. Our voice conversion system is based on spectral conversion using feed-forward neural network and parallel training.
Detekce lidské řeči v audio nahrávce
Břenek, Roman ; Grézl, František (oponent) ; Matějka, Pavel (vedoucí práce)
Tato práce se zabývá technikami detekce lidské řeči v nahrávkách. Je nutné při rozpoznávání správně klasifikovat všechny neřečové segmenty a naopak rozpoznat veškerou řeč i v hlučných a zašuměných prostředích. V práci je popsán celý proces rozpoznávání, tzn. digitalizace audio signálu, extrakce příznaků, trénování klasifikátoru, rozpoznávání a samotné vyhodnocení a úpravy před vyhodnocením. Pro rozpoznávání byly použity tři systémy, z nichž jeden je založen na fonémovém rozpoznávání pomocí neuronových sítí, další dva jsou založené na GMM, přičemž každý systém byl testován na třech datových sadách - Tactical Speaker Identification Speech Corpus (TSID), Ham Radio (HR) a Rich Transcription Evaluation (RT05-RT07).  Nejlepší výsledky každého systému jsou pak zhodnoceny i s výsledky třetích stran.

Chcete být upozorněni, pokud se objeví nové záznamy odpovídající tomuto dotazu?
Přihlásit se k odběru RSS.