Original title:
Ovládání mobilní aplikace hlasem
Translated title:
Controlling Mobile App by Voice
Authors:
Cologna, Adam ; Szőke, Igor (referee) ; Herout, Adam (advisor) Document type: Bachelor's theses
Year:
2024
Language:
cze Publisher:
Vysoké učení technické v Brně. Fakulta informačních technologií Abstract:
[cze][eng]
Cílem této práce je prozkoumat, analyzovat a porovnat dostupné knihovny pro ovládání mobilních aplikací hlasovými pokyny. Zvolený problém jsem dle zadání práce řešil hlavně pro operační systém Android a bral jsem v potaz nejen knihovny pro detekci klíčových slov, ale i knihovny se zaměřením na porozumění řeči. Pro zvolené knihovny jsem provedl testování přesnosti detekce hlasových pokynů a zátěžové testy. Pro potřeby propojení vybraných knihoven vznikla aplikace v moderním programovacím jazyce Kotlin s využitím Jetpack Compose. Hlavním přínosem této práce jsou právě provedené experimenty a výsledná doporučení ohledně zkoumaných knihoven. Mezi nejefektivnější řešení patřila ta od Microsoft Azure a třída Android Speech Recognizer. Hlavními překážkami pro jednotlivé knihovny byla vzdálenost mezi řečníkem a mikrofonem a rušivá hudba v pozadí.
The aim of this bachelor's thesis is to explore, analyze, and compare available libraries for controlling mobile applications with voice commands. According to the thesis requirements, I solved the problem primarily for the Android operating system. I have considered not only libraries for keyword detection but also those using the speech recognition technology. For the selected libraries, I conducted accuracy testing for voice command detection and performance testing. To facilitate the integration of the chosen libraries, an application was developed in the modern programming language Kotlin using Jetpack Compose. The main contribution of this work is the experiments carried out and the resulting recommendations regarding the examined libraries. Among the most effective solutions were those from Microsoft Azure and the Android Speech Recognizer class. The main obstacles for each library were the distance between the speaker and the microphone, as well as distracting background music.
Keywords:
Android; Java; Jetpack Compose; keyword spotting; Kotlin; mobile application; speech recognition; Android; detekce klíčových slov; Java; Jetpack Compose; Kotlin; mobilní aplikace; porozumění lidské řeči
Institution: Brno University of Technology
(web)
Document availability information: Fulltext is available in the Brno University of Technology Digital Library. Original record: https://hdl.handle.net/11012/247467