Original title:
Rozpoznání paralingvistických signálů v řečovém projevu
Translated title:
Paralinguistic signals recognition in spoken dialogs
Authors:
Mašek, Jan ; Míča, Ivan (referee) ; Atassi, Hicham (advisor) Document type: Master’s theses
Year:
2010
Language:
cze Publisher:
Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií Abstract:
[cze][eng]
Tento dokument popisuje tři metody pro klasifikaci paralingvistických výrazů jako smích a pláč z každodenních rozhovorů analýzou zvukového signálu. Pro tento účel byla vytvořena databáze nahrávek. Protože se dnes často setkáváme i s hudbou, byly do databáze začleněny i stavy: řeč, hudba, hudba se zpěvem a řeč s hudbou v pozadí. Extrakce příznaků, redukce příznaků a klasifikace jsou společné kroky v rozpoznání pro všechny tři popsané metody. Rozdíl metod spočívá v samotné klasifikaci. První metoda využívá přímého přístupu a klasifikuje všechny třídy najednou. Druhá metoda využívá postupnou klasifikaci ve stromové struktuře, která se skládá z pěti dílčích klasifikátorů. Poslední metoda využívá klasifikaci každé z dvojic tříd samostatně. Nejlepší příznaky pro každou z dílčích klasifikací byly identifikovány využitím statistické metody F-poměru a pro každou klasifikaci byly použity Gaussovy smíšené modely.
This document describes the three methods for the detection and classification of paralinguistic expressions such as laughing and crying from usual speech by analysis of the audio signal. The database of records was originally designed for this purpose. When analyzing everyday dialogs, music might be included, so the database was extended by four new classes as speech, music, singing with music and usual speech with background music. Feature extraction, feature reduction and classification are common steps in recognizing for all three methods. Difference of the methods is given by classification process in detail. One classification of all six classes at once is proposed in the first method called straight approach. In the second method called decision tree oriented approach we are using five intuitive sub classifiers in the tree structure and the final method uses for classification emotion coupling approach. The best features were reduced by feature evaluation using F-ratio and GMM classifiers were used for the each classification part.
Keywords:
classification; database; F-ratio; features; GMM; Matlab; Matlab Simulink; paralinguistics; preprocessing; recognition; selection; databáze; F-poměr; GMM; klasifikace; Matlab; Matlab Simulink; paralingvistika; předzpracování; příznaky; rozpoznání; selekce
Institution: Brno University of Technology
(web)
Document availability information: Fulltext is available in the Brno University of Technology Digital Library. Original record: http://hdl.handle.net/11012/4721