Název:
Ovládání mobilní aplikace hlasem
Překlad názvu:
Controlling Mobile App by Voice
Autoři:
Cologna, Adam ; Szőke, Igor (oponent) ; Herout, Adam (vedoucí práce) Typ dokumentu: Bakalářské práce
Rok:
2024
Jazyk:
cze
Nakladatel: Vysoké učení technické v Brně. Fakulta informačních technologií
Abstrakt: [cze][eng]
Cílem této práce je prozkoumat, analyzovat a porovnat dostupné knihovny pro ovládání mobilních aplikací hlasovými pokyny. Zvolený problém jsem dle zadání práce řešil hlavně pro operační systém Android a bral jsem v potaz nejen knihovny pro detekci klíčových slov, ale i knihovny se zaměřením na porozumění řeči. Pro zvolené knihovny jsem provedl testování přesnosti detekce hlasových pokynů a zátěžové testy. Pro potřeby propojení vybraných knihoven vznikla aplikace v moderním programovacím jazyce Kotlin s využitím Jetpack Compose. Hlavním přínosem této práce jsou právě provedené experimenty a výsledná doporučení ohledně zkoumaných knihoven. Mezi nejefektivnější řešení patřila ta od Microsoft Azure a třída Android Speech Recognizer. Hlavními překážkami pro jednotlivé knihovny byla vzdálenost mezi řečníkem a mikrofonem a rušivá hudba v pozadí.
The aim of this bachelor's thesis is to explore, analyze, and compare available libraries for controlling mobile applications with voice commands. According to the thesis requirements, I solved the problem primarily for the Android operating system. I have considered not only libraries for keyword detection but also those using the speech recognition technology. For the selected libraries, I conducted accuracy testing for voice command detection and performance testing. To facilitate the integration of the chosen libraries, an application was developed in the modern programming language Kotlin using Jetpack Compose. The main contribution of this work is the experiments carried out and the resulting recommendations regarding the examined libraries. Among the most effective solutions were those from Microsoft Azure and the Android Speech Recognizer class. The main obstacles for each library were the distance between the speaker and the microphone, as well as distracting background music.
Klíčová slova:
Android; detekce klíčových slov; Java; Jetpack Compose; Kotlin; mobilní aplikace; porozumění lidské řeči; Android; Java; Jetpack Compose; keyword spotting; Kotlin; mobile application; speech recognition
Instituce: Vysoké učení technické v Brně
(web)
Informace o dostupnosti dokumentu:
Plný text je dostupný v Digitální knihovně VUT. Původní záznam: https://hdl.handle.net/11012/247467