Název:
Implementace detektoru klíčových slov do mobilního telefonu (Symbian 60)
Překlad názvu:
Keyword Spotting Implementation to Mobil Phone (Symbian 60)
Autoři:
Cipr, Tomáš ; Schwarz, Petr (oponent) ; Szőke, Igor (vedoucí práce) Typ dokumentu: Diplomové práce
Jazyk:
cze
Nakladatel: Vysoké učení technické v Brně. Fakulta informačních technologií
Abstrakt: [cze][eng]
Detektor klíčových slov je jednou z aplikací automatického rozpoznávání řeči. Úkolem detektoru je určit, ve kterých místech souvislého toku řeči se vyskytují slova ze zadaného seznamu. Detektor klíčových slov najde řadu uplatnění mimo jiné i v mobilních telefonech, např. pro jejich ovládání hlasem. S nástupem OS Symbian se otevřela možnost jak detektor implementovat i pro tato zařízení. Zpráva popisuje jednak teoretická a odborná východiska realizace detektoru a také jeho následnou implementaci. Nejdříve je uveden operační systém Symbian s ohledem na praktické řešení úkolu. Dále je popsán způsob detekce klíčových slov od vstupního řečového signálu až po výstup, zda a která slova byla nalezena. Následně je prezentován objektový návrh detektoru a podrobněji popsána jeho implementace. Závěrem jsou shrnuty dosažené výsledky a nastíněn další vývoj.
Keyword spotting is one of the many applications of automatic speech recognition. Its purpose is determining spots in given utterance in which some of the specified words were spoken. Keyword spotting has a great potential to enhance performance of new applications as well as the existing ones. An example could be a mobile phone voice control. Due to OS Symbian's coming to the market it is even possible for end user to implement a keyword spotting for a mobile phone on his or her own. The thesis describes theoretical prerequisites for keyword spotting and its implementation. Firstly the OS Symbian is presented with respect to the given task. Secondly each step of keyword spotting process is described. Finally the object design of keyword spotter is presented followed by implementation description. The thesis concludes with results review and notes on possible improvements.
Klíčová slova:
banky filtrů; DCT; detektor klíčových slov; EPOC; extrakce příznaků; mel spektrum; mobilní telefon; neuronová síť; perceptron; perceptuální lineární predikce; PLP; rozpoznávání řeči; S60; Series 60; smartphone; Symbian; Viterbiho dekodér.; zpracování řeči; cellular phone; DCT; EPOC; feature extraction; filter banks; keyword spotting; mel spectrum; mobile phone; neural network; perceptron; perceptual linear prediction; PLP; S60; Series 60; smartphone; speech processing; speech recognition; Symbian; Viterbi decoder.
Instituce: Vysoké učení technické v Brně
(web)
Informace o dostupnosti dokumentu:
Plný text je dostupný v Digitální knihovně VUT. Původní záznam: http://hdl.handle.net/11012/54039