Original title:
Modul do prohlížeče přednášek pro opravování výstupu rozpoznávače uživatelem
Translated title:
Module for a Lecture Browser for Correcting the Output of Speech Recognizer
Authors:
Srb, Pavel ; Schwarz, Petr (referee) ; Fapšo, Michal (advisor) Document type: Bachelor's theses
Year:
2009
Language:
cze Publisher:
Vysoké učení technické v Brně. Fakulta informačních technologií Abstract:
[cze][eng]
Jádrem práce je rozšíření prohlížeče o funkci opravy přepisů z rozpoznávače uživatelem, včetně vytvoření serveru, který přepisy skladuje a umožňuje jejich sdílení. V úvodu je zmíněna motivace pro práci s multimédii ve výpočetní technice. Dále jsou vyjmenovány kategorie výzkumu rozpoznávání řeči na Fakultě informačních technologií. Velká pozornost je věnována popisu multimediálního prohlížeče, který slouží pro testování a prezentaci technologií rozpoznávačů a v budoucnu se předpokládá jeho využití i jako studijní pomůcky nebo přehrávače pro běžné uživatele. Jsou zde definovány požadované vlastnosti tohoto přehrávače, návrhy a popis jejich realizace, potažmo celé architektury přehrávače, založené na C++, wxWidgets, XML i HTTP.
The core of my work is a browser upgrade, which contains user based transcript-correction from speech recognizer, including creation of transcription storage and sharing server. Introduction of my work mentions motivation for multimodal usage in computer science sphere. Further in text is list of speech recognition reasearch categories from Faculty of Information Technology. The main attention is given to description of multimodal browser used for browser technology testing and presentation. In future, the multimodal browser is supposed to be used as a study-utility or common user multimodal player. Required features of this player, concepts, realization description and whole C++, wxWidgets, XML, HTTP based architecture is defined.
Keywords:
C++; multimodal browser; MySQL; PHP; speech recognizer; text trancription of sound record; trancription mistakes correction; web comunication; web technologies; wxWidgets; C++; multimediální prohlížeč; MySQL; opravy chyb v přepisech; PHP; rozpoznávání plynulé řeči; síťová komunikace; textové přepisy ke zvukovému záznamu; webové technologie; wxWidgets
Institution: Brno University of Technology
(web)
Document availability information: Fulltext is available in the Brno University of Technology Digital Library. Original record: http://hdl.handle.net/11012/54570