Název:
Voice Activity Detection
Překlad názvu:
Voice Activity Detection
Autoři:
Ent, Petr ; Karafiát, Martin (oponent) ; Matějka, Pavel (vedoucí práce) Typ dokumentu: Diplomové práce
Rok:
2009
Jazyk:
eng
Nakladatel: Vysoké učení technické v Brně. Fakulta informačních technologií
Abstrakt: [eng][cze]
Práce pojednává o využití support vector machines v detekci řečové aktivity. V první části jsou zkoumány různé druhy příznaků, jejich extrakce a zpracování a je nalezena jejich optimální kombinace, která podává nejlepší výsledky. Druhá část představuje samotný systém pro detekci řečové aktivity a ladění jeho parametrů. Nakonec jsou výsledky porovnány s dvěma dalšími systémy, založenými na odlišných principech. Pro testování a ladění byla použita ERT broadcast news databáze. Porovnání mezi systémy bylo pak provedeno na databázi z NIST06 Rich Test Evaluations.
This thesis deals with usage Support Vector Machines (SVM) for Speech Activity Detection (SAD). The first part of the thesis deals with comparison of different feature extractions and different methods of construction supervectors for classifying speech using SVM. The second part presents SVM based SAD system. All experiments were performed on ERT broadcast new database. Final comparison with two other approaches (phoneme and GMM based) was done on standard NIST 2006 Rich Test Evaluation database.
Klíčová slova:
ERT broadcast news database; feature comparison; feature extraction; Gaussian Mixture Models; speech activity detection; Support Vector Machines; voice activity detection; detekce řečové aktivity; ERT databáze televizního vysílání; extrakce příznaků; porovnání příznaků; směs gaussových rozloľení; support vector machines
Instituce: Vysoké učení technické v Brně
(web)
Informace o dostupnosti dokumentu:
Plný text je dostupný v Digitální knihovně VUT. Původní záznam: http://hdl.handle.net/11012/52725