Original title:
Implementace detektoru klíčových slov do mobilního telefonu (Symbian 60)
Translated title:
Keyword Spotting Implementation to Mobil Phone (Symbian 60)
Authors:
Cipr, Tomáš ; Schwarz, Petr (referee) ; Szőke, Igor (advisor) Document type: Master’s theses
Language:
cze Publisher:
Vysoké učení technické v Brně. Fakulta informačních technologií Abstract:
[cze][eng]
Detektor klíčových slov je jednou z aplikací automatického rozpoznávání řeči. Úkolem detektoru je určit, ve kterých místech souvislého toku řeči se vyskytují slova ze zadaného seznamu. Detektor klíčových slov najde řadu uplatnění mimo jiné i v mobilních telefonech, např. pro jejich ovládání hlasem. S nástupem OS Symbian se otevřela možnost jak detektor implementovat i pro tato zařízení. Zpráva popisuje jednak teoretická a odborná východiska realizace detektoru a také jeho následnou implementaci. Nejdříve je uveden operační systém Symbian s ohledem na praktické řešení úkolu. Dále je popsán způsob detekce klíčových slov od vstupního řečového signálu až po výstup, zda a která slova byla nalezena. Následně je prezentován objektový návrh detektoru a podrobněji popsána jeho implementace. Závěrem jsou shrnuty dosažené výsledky a nastíněn další vývoj.
Keyword spotting is one of the many applications of automatic speech recognition. Its purpose is determining spots in given utterance in which some of the specified words were spoken. Keyword spotting has a great potential to enhance performance of new applications as well as the existing ones. An example could be a mobile phone voice control. Due to OS Symbian's coming to the market it is even possible for end user to implement a keyword spotting for a mobile phone on his or her own. The thesis describes theoretical prerequisites for keyword spotting and its implementation. Firstly the OS Symbian is presented with respect to the given task. Secondly each step of keyword spotting process is described. Finally the object design of keyword spotter is presented followed by implementation description. The thesis concludes with results review and notes on possible improvements.
Keywords:
cellular phone; DCT; EPOC; feature extraction; filter banks; keyword spotting; mel spectrum; mobile phone; neural network; perceptron; perceptual linear prediction; PLP; S60; Series 60; smartphone; speech processing; speech recognition; Symbian; Viterbi decoder.; banky filtrů; DCT; detektor klíčových slov; EPOC; extrakce příznaků; mel spektrum; mobilní telefon; neuronová síť; perceptron; perceptuální lineární predikce; PLP; rozpoznávání řeči; S60; Series 60; smartphone; Symbian; Viterbiho dekodér.; zpracování řeči
Institution: Brno University of Technology
(web)
Document availability information: Fulltext is available in the Brno University of Technology Digital Library. Original record: http://hdl.handle.net/11012/54039