Original title:
Moderní rozpoznávače řečové aktivity
Translated title:
Modern Speech/pause Detectors
Authors:
Adamec, Michal ; Smékal, Zdeněk (referee) ; Rajmic, Pavel (advisor) Document type: Master’s theses
Year:
2008
Language:
cze Publisher:
Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií Abstract:
[cze][eng]
Tato diplomová práce pojednává o standardních metodách detekce řeč/pauza - detektory řečové aktivity pracující na principech krátkodobé energie, reálného kepstra, krátkodobé intenzity a o kombinaci těchto tří detektorů. Dále popisuje detektory založené na skrytých Markovových modelech a detektor řečové aktivity popsaný ve standardu ITU-T G.729. Popsané detektory byly implementovány ve vývojovém prostředí MATLAB. Dále bylo vytvořeno uživatelské rozhraní pro testování funkce implementovaných detektorů. Na základě testování bylo provedeno vyhodnocení pomocí ROC charakteristik.
This masters theses deals with standard detection methods of speech/pause - voice activity detectors are based on the principles of short-time energy, real spectrum, short-time intensity and on a combinations of these three detectors. In the next parts, there are mentioned other voice activity detectors based on hidden Markovov‘s models and a detector described in the ITU-T G.729 standard. All the detectors, mentioned above, were implemented in research environment MATLAB. Further there was created an user interface for testing functions of the implemented detectors. Finally, there was done an evaluation by ROC characteristics according to the results of the testing.
Keywords:
ITU-T G.729; real cepstrum; short-time energy; short-time intensity; Voice activity detectors; Detektory řečové aktivity; ITU-T G.729; krátkodobá energie; krátkodobá intenzita; reálné kepstrum
Institution: Brno University of Technology
(web)
Document availability information: Fulltext is available in the Brno University of Technology Digital Library. Original record: http://hdl.handle.net/11012/16807