Název:
Hlasové ovládání pro efektivní editaci textu
Překlad názvu:
Hlasové ovládání pro efektivní editaci textu
Autoři:
Citorík, Juraj ; Lokoč, Jakub (vedoucí práce) ; Skopal, Tomáš (oponent) Typ dokumentu: Bakalářské práce
Rok:
2013
Jazyk:
eng
Abstrakt: [eng][cze] The aim of this thesis is to provide a comprehensive introduction to digital sound processing and speech recognition. Selected speech recognition features as well as algorithms are introduced and utilized in a voice controlled text editor and a .NET class library. The performance of the features is evaluated in both speaker-dependent and speaker-independent recognition of commands related to text editing. The library provides a straightforward way of implementing a speaker-dependent, domain-constrained voice recognition in an arbitrary application. It is used in a simple voice controlled text editor. The editor allows the user to assign voice commands to built-in actions. In this way, it is possible for inexperienced users to access and use advanced features of the program without having to learn complex workflows. Moreover, this approach is language-agnostic and can even be used by people with speech impairments as opposed to majority of presently used voice recognition systems. The results of the experiments indicate that, given a recording of sufficient quality, the presented features and algorithms provide an effective means to implement a speaker-dependent speech recognition system, which can be used in a voice controlled text editor. Powered by TCPDF (www.tcpdf.org)Cieľom tejto práce je poskytnúť úvod do problematiky digitálneho spracovania zvuku a rozpoznávania reči. V texte je popísaných niekoľko vybraných deskriptorov reči a algoritmov spojených s problematikou. Tieto sú použité v implementácii jednoduchého hlasom ovládaného textového editoru a .NET knižnice. Deskriptory sú porovnané s ohľadom na rýchlosť a presnosť pri použití v systéme rozpoznávania príkazov pre textový editor a to v systéme závislom alebo nezávislom na hovoriacom. Knižnica tried poskytuje jednoduchý spôsob implementácie hlasového ovládania závislého na hovoriacom v obmedzenej doméne príkazov v ľubovoľnom programe. Editor textu umožňuje užívateľovi priradiť hlasové povely k zabudovaným funkciám programu, čo napríklad umožňuje aj neskúseným užívateľom používať pokročilé funkcie bez nutnosti predošlého učenia sa napríklad klávesových skratiek. Tento prístup je navyše nezávislý na jazyku a je použiteľný aj pre ľudí s poruchami reči, čo momentálne rozšírené riešenia neumožňujú. Výsledky experimentov ukazujú, že prezentované deskriptory a algoritmy sú, za predpokladu dostatočnej kvality nahrávky, dostatočne efektívne pre použitie pri rozpoznávaní príkazov v systéme závislom na hovoriacom. Powered by TCPDF (www.tcpdf.org)
Klíčová slova:
editace textu; Hlasové ovládání; podobnostní vyhledávání; similarity search; text editing; Voice control