Název:
Neuronové sítě při klasifikaci mluvčích
Překlad názvu:
Neural networks in speaker classification
Autoři:
Svoboda, Libor ; Atassi, Hicham (oponent) ; Míča, Ivan (vedoucí práce) Typ dokumentu: Diplomové práce
Rok:
2008
Jazyk:
cze
Nakladatel: Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií
Abstrakt: [cze][eng]
Obsah této práce je zaměřen na neuronové sítě při klasifikaci mluvčích. Pojednává o problematice zpracování řečového signálu a jsou zde uvedeny i některé typy neuronových sítí. Součástí práce bylo sestavení databáze nahrávek od řečníků různého pohlaví a věku. Z této databáze pak byla sestavena trénovací a testovací skupina. Dále byly navrženy čtyři klasifikátory. Jeden na bázi směsi Gaussových hustotních funkcí a tři neuronové klasifikátory. Tyto systémy byly testovány a analyzovány podle věku, pohlaví a na závěr pro obě tyto kritéria. Současně je věnována pozornost i volbě vhodných příznaků v každé této úloze klasifikace. Na konci práce jsou uvedeny výsledky analýz pro jednotlivé skupiny i příznaky. Z těchto výsledků jsou stanoveny nejvhodnější příznaky, pro danou úlohu klasifikace a také nejúspěšnější klasifikátory.
The content of this work is focused on the neural network per speaker recognition. The work deals with problems of processing speech signal and there are introduction some types of neural network. The part of work was made database of records from speakers with have various sex and ages. The train and test group was made from the database. For classifier were suggested afterwards. One of them was nominated on base Gaussian mixture model and three of them were nominated on neural. This system was tested and analyzed on the basis of age, gender and both criterions each other at the end. Attention is focused on choice suitable feature in each mission of classification at the same time. At the end of work are introduced results of analysis for individual groups and features. The most suitable features are diagnosed from given mission of classification and the most prosperous classifier.
Klíčová slova:
GMM; klasifikace mluvčích; neuronová síť; pohlaví; věk; age; gender; GMM; neural network; speaker recognition
Instituce: Vysoké učení technické v Brně
(web)
Informace o dostupnosti dokumentu:
Plný text je dostupný v Digitální knihovně VUT. Původní záznam: http://hdl.handle.net/11012/18622