Název: Implementation of 1D mathematical model of vocal cavities into TTS synthesizer – preliminary study
Autoři: Radolf, Vojtěch ; Horák, Petr
Typ dokumentu: Příspěvky z konference
Konference/Akce: Interaction and Feedbacks 2012 /19./, Praha (CZ), 2012-11-27 / 2012-11-28
Rok: 2012
Jazyk: eng
Abstrakt: Simplified 1D mathematical models of the human vocal tract were modified for using them in Text-To-Speech systems so that they help to simulate emotional speech. The geometry (area function) of the models for all Czech vowels was modified using the inverse task optimization procedure so that the computed formant frequencies match the measured formant frequencies of utterances of professional speaker. Output acoustic pressure signal generated from the models in wav format sounded satisfactorily for all the vowels and fundamental frequencies varied in an octave range from 77 Hz to 156 Hz. Neverthelles more testing procedures are needed to verify reliability and quickness of the model as well as intelligibility of generated utterances especially in formant TTS system and linear predictive TTS system.
Klíčová slova: biomechanics of voice; prosody modeling; synthetic speech
Číslo projektu: CEZ:AV0Z20760514 (CEP), CEZ:AV0Z20670512 (CEP), GPP101/12/P579 (CEP)
Poskytovatel projektu: GA ČR
Zdrojový dokument: Interaction and Feedbacks 2012, ISBN 978-80-87012-43-7

Instituce: Ústav termomechaniky AV ČR (web)
Informace o dostupnosti dokumentu: Dokument je dostupný v příslušném ústavu Akademie věd ČR.
Původní záznam: http://hdl.handle.net/11104/0213969

Trvalý odkaz NUŠL: http://www.nusl.cz/ntk/nusl-135432


Záznam je zařazen do těchto sbírek:
Věda a výzkum > AV ČR > Ústav termomechaniky
Konferenční materiály > Příspěvky z konference
 Záznam vytvořen dne 2013-01-04, naposledy upraven 2021-11-24.


Není přiložen dokument
  • Exportovat ve formátu DC, NUŠL, RIS
  • Sdílet