Název:
Odhad přesnosti řečových technologií na základě měření signálové kvality a obsahové bohatosti audia
Překlad názvu:
Estimation of accuracy of speech technologies based on signal quality and audio content richness
Autoři:
Nezval, Jiří ; Smital, Lukáš (oponent) ; Schwarz, Petr (vedoucí práce) Typ dokumentu: Diplomové práce
Rok:
2020
Jazyk:
cze
Nakladatel: Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií
Abstrakt: [cze][eng]
Práce se zabývá teoretickým rozborem vzniku řeči, představuje možnosti využití řečových technologií a vysvětluje současný přístup k fonetickému přepisu řečových nahrávek. Jsou v ní popsány metriky hodnocení kvality audionahrávek, které rozdělujeme do dvou oddělených skupin. První skupinou jsou metriky signálové kvality, druhou metriky obsahové bohatosti. Prvním cílem praktické části je poté vytvořit statistický model pro predikci přesnosti strojového přepisu řečové nahrávky na základě měření její kvality. Druhým cílem je posoudit, které dílčí metriky jsou pro predikci přesnosti strojového přepisu nejdůležitější.
This thesis discusses theoretical analysis of the origin of speech, introduces applications of speech technologies and explains the contemporary approach to phonetical transcription of speech recordings. Furthermore, it describes the metrics of audio recordings quality assessment, which is split into two discrete classes. The first one groups signal quality metrics, while the other one groups content richness metrics. The first goal of the practical section is to create a statistical model for accuracy prediction of machine transcription of speech recordings based on a measurement of their quality. The second goal is to evaluate which partial metrics are the most essential for accuracy prediction of machine transcription.
Klíčová slova:
fonetický přepis; obsahová bohatost; predikce přesnosti strojového přepisu; regrese; signálová kvalita; řeč; řečové technologie; accuracy of automatic transcription; content richness; phonetic transcription; regression; signal quality; speech; speech technologies
Instituce: Vysoké učení technické v Brně
(web)
Informace o dostupnosti dokumentu:
Plný text je dostupný v Digitální knihovně VUT. Původní záznam: http://hdl.handle.net/11012/189309