Original title:
Odhad přesnosti řečových technologií na základě měření signálové kvality a obsahové bohatosti audia
Translated title:
Estimation of accuracy of speech technologies based on signal quality and audio content richness
Authors:
Nezval, Jiří ; Smital, Lukáš (referee) ; Schwarz, Petr (advisor) Document type: Master’s theses
Year:
2020
Language:
cze Publisher:
Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií Abstract:
[cze][eng]
Práce se zabývá teoretickým rozborem vzniku řeči, představuje možnosti využití řečových technologií a vysvětluje současný přístup k fonetickému přepisu řečových nahrávek. Jsou v ní popsány metriky hodnocení kvality audionahrávek, které rozdělujeme do dvou oddělených skupin. První skupinou jsou metriky signálové kvality, druhou metriky obsahové bohatosti. Prvním cílem praktické části je poté vytvořit statistický model pro predikci přesnosti strojového přepisu řečové nahrávky na základě měření její kvality. Druhým cílem je posoudit, které dílčí metriky jsou pro predikci přesnosti strojového přepisu nejdůležitější.
This thesis discusses theoretical analysis of the origin of speech, introduces applications of speech technologies and explains the contemporary approach to phonetical transcription of speech recordings. Furthermore, it describes the metrics of audio recordings quality assessment, which is split into two discrete classes. The first one groups signal quality metrics, while the other one groups content richness metrics. The first goal of the practical section is to create a statistical model for accuracy prediction of machine transcription of speech recordings based on a measurement of their quality. The second goal is to evaluate which partial metrics are the most essential for accuracy prediction of machine transcription.
Keywords:
accuracy of automatic transcription; content richness; phonetic transcription; regression; signal quality; speech; speech technologies; fonetický přepis; obsahová bohatost; predikce přesnosti strojového přepisu; regrese; signálová kvalita; řeč; řečové technologie
Institution: Brno University of Technology
(web)
Document availability information: Fulltext is available in the Brno University of Technology Digital Library. Original record: http://hdl.handle.net/11012/189309