Original title:
Optimalizovaná detekce řečové aktivity v prostředí s proměnnými vlastnostmi
Translated title:
Optimized Voice Activity Detection under Varying Environments
Authors:
Míča, Ivan ; Přibil, Jiří (referee) ; Vích, Robert (referee) ; Smékal, Zdeněk (advisor) Document type: Doctoral theses
Year:
2014
Language:
cze Publisher:
Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií Abstract:
[cze][eng]
Tato práce se zabývá problematikou automatické detekce řečově aktivních úseků signálu. Jsou analyzovány dopady nepříznivých podmínek na spolehlivost detekce a jsou uvedeny hlavní současné i historické směry výzkumu této problematiky. Teoretický rozbor významných detekčních metod a používaných modelů je podepřen testy na laboratorní i na aplikačně specifické databázi odpovídající proměnlivým pracovním podmínkám detektorů řeči. Na základě analýzy rozebíraných algoritmů a jejich výkonnosti ve variabilních simulovaných i reálných podmínkách jsou detekční metody optimalizovány pro prostředí s proměnnými vlastnostmi.
This thesis deals with the issue of algorithmic voice activity detection. Impacts of adverse conditions on the reliability of detection is analysed, and main historical and up-to-date approaches to this issue are discussed. Simulations on both synthetic, and application specific labeled speech databases are used to support the theoretical analysis of important VAD methods. Based on the theoretical analysis together with the performance results, an optimization is proposed that is capable to overcome some limitations of the current methods when dealing with variable working conditions.}
Keywords:
voice activity detection optimization varying environments; detekce řečové aktivity optimalizace proměnné pracovní podmínky
Institution: Brno University of Technology
(web)
Document availability information: Fulltext is available in the Brno University of Technology Digital Library. Original record: http://hdl.handle.net/11012/30919