Original title:
Implementace jednoduchého rozpoznávače řeči pro Android
Translated title:
Implementation of Simple Speech Recognizer in Android
Authors:
Čuba, Eduard ; Glembek, Ondřej (referee) ; Szőke, Igor (advisor) Document type: Bachelor's theses
Year:
2018
Language:
cze Publisher:
Vysoké učení technické v Brně. Fakulta informačních technologií Abstract:
[cze][eng]
Cieľom projektu je vytvoriť jednoduchý rozpoznávač reči pre platformu Android. Práca rozoberá základné komponenty rozpoznávača reči a venuje sa technikám, ktoré boli použité pre optimalizáciu procesu rozpoznávača reči na zariadeniach so systémom Anrdoid. Ako prvá je popísaná teória extrakcie akustických príznakov, odhadu posteriórnych pravdepodobností fonémov a dynamického dekódovania. Následnej je popísaný dizajn a implementácia dekodéra, ktorý prevádza sériu rečových príznakov na text, za použitia obmedzených výpočetných prostriedkov mobilného zariadenia. Implementácia je rozdelená do modulov tvoriacich knižnicu, ktorú je možno jednoducho rozšíriť, či integrovať do požadovanej aplikácie. Do rozpoznávača je taktiež možné dodať vlastné modely, ktoré môžu byť navrhnuté a natrénované pre konkrétne použitie. V experimentoch sme skúmali rôzne prístupy ku modelovaniu abstraktných dátových štruktúr pre reprezentáciu rozpoznávacej siete tak. V závere práca rozoberá potencionálne smery budúceho vývoja a aplikácií tohoto projektu.
The goal of this project is to implement speech recognition software for Android platform. This paper outlines fundamental components of a speech recognizer and reviews the techniques used to optimize the process of speech recognition on Android devices. Firstly, it examines the implementation of the acoustic feature extraction and phoneme estimation processes. Then, it describes the design and implementation of a decoder used to process phoneme estimations into transcription, utilizing only limited resources of a mobile device. The project is divided into several modules, forming an Android library, which should be easy to extend and can be provided with custom models tailored for the desired use. Later, this paper discloses various approaches to modeling abstract data structures for recognition network representation, as well, as the ways of further development and applications of this project.
Keywords:
Android; dynamic decoder; NDK; speech recognition; Android; dynamický dekodér; NDK; rozpoznávanie reči
Institution: Brno University of Technology
(web)
Document availability information: Fulltext is available in the Brno University of Technology Digital Library. Original record: http://hdl.handle.net/11012/85064