Original title:
Hlasové ovládání průmyslových a medicínských zařízení v rušných prostředích
Translated title:
Voice Control of Industrial and Medical Devices in Noisy Environments
Authors:
Vymětalíková, Lucie ; Matoušek, Radomil (referee) ; Dobrovský, Ladislav (advisor) Document type: Master’s theses
Year:
2023
Language:
cze Publisher:
Vysoké učení technické v Brně. Fakulta strojního inženýrství Abstract:
[cze][eng]
Tato diplomová práce se zabývá hlasovým ovládáním průmyslových a medicínských zařízení v rušných prostředích. Porovnány jsou různé modely rozpoznávání řeči i metody pro odstraňování hluku z řečových signálů. Na základě rešerše i vlastních testování je sestaven vlastní systém hlasového ovládání. Systém je složen z modelu pro detekci vzbouzecí fráze a modelu pro rozpoznávání předem nadefinovaných příkazů. Implementována je v systému i audio odezva pro operátora a spouštění skriptů dle rozpoznaných příkazů. Navržena byla také úprava laboratorního boxu OpenTube2 pro automatické otevírání.
This diploma thesis deals with voice control of industrial and medical devices in noisy environments. Different speech recognition models and methods for noise supression in speech signals are compared. Based on the research and conducted testing, a custom voice control system is designed. The system consists of a wake word detection model and a model for the predefined commands recognition. An audio response for the operator and a script execution based on the recognized commands is also implemented in the system. A modification for automatic door opening of the OpenTube2 laboratory box was designed.
Keywords:
ASR; automatic door opening; beamforming; noise suppression in speech signal; Porcupine; speech recognition; Voice control; Whisper; ASR; automatické otevírání; beamforming; Hlasové ovládání; Porcupine; potlačení hluku v řečovém signálu; rozpoznávání řeči; Whisper
Institution: Brno University of Technology
(web)
Document availability information: Fulltext is available in the Brno University of Technology Digital Library. Original record: http://hdl.handle.net/11012/212388