Název:
Identifikace pauz v rušeném řečovém signálu
Překlad názvu:
Identification of pauses in noisy speech signal
Autoři:
Kepák, Petr ; Míča, Ivan (oponent) ; Smékal, Zdeněk (vedoucí práce) Typ dokumentu: Diplomové práce
Rok:
2011
Jazyk:
cze
Nakladatel: Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií
Abstrakt: [cze][eng]
Základním problémem řeči je úplné oddělení přirozeného šumu, který vzniká při správné artikulaci znělých a neznělých souhlásek od šumu a rušení okolního prostředí. Cílem diplomové práce je najít efektivní metodu, které by dokázala identifikovat pauzy bez řečové aktivity, v nichž je možné identifikovat vlastnosti šumu a rušení. Jakmile je správně šum určen, pak již je možné využít různých metod pro jeho odstranění. V diplomové práci jsou popsány dvě metody identifikace pauz. Tyto metody jsou naprogramované v prostředí Matlab a testovány na devíti řečových nahrávkách. Analýza výsledků metod byla provedena pomocí ROC (Receiver Operating Characteristic) křivek. V závěru jsou shrnuty výsledky analýzy vytvořených metod.
The basic problem of speech is a complete separation of the natural noise which arise from correct articulation of voiced and unvoiced consonants from noise and disturbance environment. Objective of this master’s thesis is to find an effective method that could identify the pauses without speech activity, which can identify the properties of noise and disturbance. Once the noise is correctly identified, it is already possible to use different methods for its removal. The master’s thesis describes two methods of pauses identification. These methods are programmed in Matlab and tested on nine speech recordings. Methods analysis of the results was performed using the ROC (Receiver Operating Characteristic) curves. In the end are summarized results analysis of created methods.
Klíčová slova:
FFT; pauza; průchod signálu nulou; ROC; segmentace; směrodatná odchylka; střední hodnota; řeč; šum; FFT; mean; noise; pause; ROC; segmentation; signal passes through zero; speech; standard deviation
Instituce: Vysoké učení technické v Brně
(web)
Informace o dostupnosti dokumentu:
Plný text je dostupný v Digitální knihovně VUT. Původní záznam: http://hdl.handle.net/11012/5158