Original title:
Síťový interface k detektoru klíčových slov
Translated title:
Network Interface for Keyword Spotting System
Authors:
Skotnica, Martin ; Glembek, Ondřej (referee) ; Szőke, Igor (advisor) Document type: Master’s theses
Language:
cze Publisher:
Vysoké učení technické v Brně. Fakulta informačních technologií Abstract:
[cze][eng]
Rozpoznávání řeči je oblastí, která je v současné době celosvětově intenzivně studována. Systémy schopné rozpoznat mluvenou řeč se stávají součástí běžného života v mnoha aplikacích. Jednou z nich je i detekce klíčových slov, způsob jak odhalit výskyt určitých slov v datech. Detektor vyvinutý na VUT Fakultě informatiky nám umožňuje detekovat tyto slova. Cílem této práce je tedy navrhnout a implementovat síťový interface k detektoru klíčových slov na bázi klient/server. Cílová aplikace se připojí na server a posílá mu zvuková data. Server na tyto data spouští detektor klíčových slov a výsledek posílá zpět klientovi, kde se interaktivně zobrazí uživateli.
A considerable part of the research in computer science is dedicated to speech recognition as the speech-controlled systems become useful in many applications. One of them is the keyword spotting which makes possible to find words in audio data. Such a detector is developed at BUT Faculty of Information Technology. The goal of this work is to propose a network interface to this keyword detector based on client/server architecture. Client connects to the server and sends audio data. Server runs keyword detector with this received data and sends the result of keyword spotting back to client. Finally client visualizes the result and interact with user.
Keywords:
audio processing; client; IP; keywords spotting; server; socket; speech processing; STK toolkit; TCP; wxWidgets; detektor klíčových slov; IP; klient; rozpoznávání řeči; server; soket; STK toolkit; TCP; wxWidgets; zpracování zvuku
Institution: Brno University of Technology
(web)
Document availability information: Fulltext is available in the Brno University of Technology Digital Library. Original record: http://hdl.handle.net/11012/54026