Název:
Rozpoznávání a klasifikace emocí na základě analýzy řeči
Překlad názvu:
Emotional State Recognition and Classification Based on Speech Signal Analysis
Autoři:
Černý, Lukáš ; Atassi, Hicham (oponent) ; Smékal, Zdeněk (vedoucí práce) Typ dokumentu: Diplomové práce
Rok:
2010
Jazyk:
cze
Nakladatel: Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií
Abstrakt: [cze][eng]
Diplomová práce se soustředí na klasifikaci emocí. Práce pojednává o parametrizaci zvukových souborů pomoci segmentálních a suprasegmentálních metod s ohledem na jejich další použití. Tato databáze obsahuje mnoho zvukových nahrávek s emocemi. Z těchto zvukových nahrávek jsou vytvořeny data, které jsou rozděleny do dvou částí. První část je použita pro trénik a druhá pro klasifikaci. Práce je soustředěna hlavně na samoorganizující sítě. Tato práce obsahuje programy v Matlabu, které mohou být použity pro parametrizaci jakékoliv databáze. Parametrizovaná data jsou předložena samoorganizující síťi ke klasifikaci. Dosažené výsledky jsou prezentovány na konci diplomové práce.
The diploma thesis focuses on classification of emotions. Thesis deals about parameterization of sounds files by suprasegment and segment methods with regard for next used of these methods. Berlin database is used. This database includes many of sounds records with emotions. Parameterization creates files, which are divided to two parts. First part is used for training and second part is used for testing. Point of interest is self-organization network. Thesis includes Matlab´s program which can be used for parameterization of any database. Data are classified by self-organization network after parameterization. Results of hits rates are presented at the end of this diploma thesis.
Klíčová slova:
emoce; energie; Kohenenova neuronová síť; MFCC; neuronová síť; prosodie; příznaky; rozpoznávání; samorganizující neuronová síť; výběr příznaků; ZCR; základní tón řeči; artificial neural network; clasification; emotion; energy; extraction of characteristic; fundamental frequence; Kohehen neural network; MFCC; prosody; recognation; self-organizing network; ZCR
Instituce: Vysoké učení technické v Brně
(web)
Informace o dostupnosti dokumentu:
Plný text je dostupný v Digitální knihovně VUT. Původní záznam: http://hdl.handle.net/11012/10673