Název:
Konverze šeptané řeči na normální
Překlad názvu:
Conversion of Whispered to Normal Voice
Autoři:
Gajda, Richard ; Černocký, Jan (oponent) ; Brukner, Jan (vedoucí práce) Typ dokumentu: Bakalářské práce
Rok:
2021
Jazyk:
eng
Nakladatel: Vysoké učení technické v Brně. Fakulta informačních technologií
Abstrakt: [eng][cze]
Cílem této práce je vyvinout funkční program, který konvertuje vstupní šeptanou řeč na neutrální za pomoci predikce hlasového buzení, která je získána pomocí neuronových sítí. Práce je založena na studii z Indian Institute of Science v indickém Bengalúru. Řešení je provedeno následovně: nejprve získáme trénovací dataset řečníků, poté implementujeme zpracování řeči a její parametrizaci za pomoci vokodéru WORLD, vytvoříme a natrénujeme neuronovou síť, provedeme experimenty, které vyhodnotíme, a nakonec navrhneme použití pro budoucí aplikace a vylepšení.
The aim of this thesis is to develop a working program, that converts whispered speech input into voice using vocal excitation prediction, which is obtained from a neural network. The work is based on a study from Indian Institute of Science in Bengalore, India. The approach to the solution is the following: to acquire a dataset from training speakers, to implement the speech parameterization using the WORLD vocoder, to implement and train the neural networks, to experiment, to evaluate the results and, finally, to propose future applications and improvements.
Klíčová slova:
BLSTM; conversion.; Speech synthesis; whispered speech; WORLD; BLSTM; konverze.; Syntéza řeči; WORLD; šepot
Instituce: Vysoké učení technické v Brně
(web)
Informace o dostupnosti dokumentu:
Plný text je dostupný v Digitální knihovně VUT. Původní záznam: http://hdl.handle.net/11012/198902