Název:
Rozpoznání emočního stavu člověka z řeči
Překlad názvu:
Automatic vocal-oriented recognition of human emotions
Autoři:
Houdek, Miroslav ; Přinosil, Jiří (oponent) ; Atassi, Hicham (vedoucí práce) Typ dokumentu: Diplomové práce
Rok:
2009
Jazyk:
cze
Nakladatel: Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií
Abstrakt: [cze][eng]
Tato diplomová práce pojednává o rozpoznání emočních stavů a určení pohlaví na základě analýzy řečového signálu. Pro popis řečového signálu jsme využili různých prozodických a kepstrálních příznaků. Součástí práce je popis neinvazivních metod pro odhad hlasivkových pulsů. Pro jednotlivé příznaky řeči jsme vytvořili funkce v programu MATLAB. Klasifikace byla provedena pomocí GMM klasifikátoru, který využívá Gaussova rozložení pravděpodobnosti pro modelování příznakového prostoru. Dále byl sestrojen systém pro rozpoznání emočních stavů mluvčího a systém pro rozpoznání pohlaví mluvčího z řeči. Úspěšnost vytvořených systémů jsme testovali s jednotlivými příznaky na různých délkách segmentů řečového signálu a výsledné procentuální úspěšnosti rozpoznávání porovnali. Závěrem jsme testovali vliv mluvčího a pohlaví na úspěšnost rozpoznání emočních stavů.
This master thesis concerns with emotional states and gender recognition on the basis of speech signal analysis. We used various prosodic and cepstral features for the description of the speech signal. In the text we describe non-invasive methods for glottal pulses estimation. The described features of speech were implemented in MATLAB. For their classification we used the GMM classifier, which uses the Gaussian probability distribution for modeling a feature space. Furthermore, we constructed a system for recognition of emotional states of the speaker and a system for gender recognition from speech. We tested the success of created systems with several features on speech signal segments of various lengths and compared the results. In the last part we tested the influence of speaker and gender on the success of emotional states recognition.
Klíčová slova:
Emoce; GMM; hlasivkové pulsy; inverzní filtrace; LPC; MFCC; příznak; tempo řeči; základní tón.; Emotion; feature; fundamental frequency.; glottal pulses; GMM; inverse filtering; LPC; MFCC; rate of speech
Instituce: Vysoké učení technické v Brně
(web)
Informace o dostupnosti dokumentu:
Plný text je dostupný v Digitální knihovně VUT. Původní záznam: http://hdl.handle.net/11012/10276