Název:
Modul do prohlížeče přednášek pro opravování výstupu rozpoznávače uživatelem
Překlad názvu:
Module for a Lecture Browser for Correcting the Output of Speech Recognizer
Autoři:
Srb, Pavel ; Schwarz, Petr (oponent) ; Fapšo, Michal (vedoucí práce) Typ dokumentu: Bakalářské práce
Rok:
2009
Jazyk:
cze
Nakladatel: Vysoké učení technické v Brně. Fakulta informačních technologií
Abstrakt: [cze][eng]
Jádrem práce je rozšíření prohlížeče o funkci opravy přepisů z rozpoznávače uživatelem, včetně vytvoření serveru, který přepisy skladuje a umožňuje jejich sdílení. V úvodu je zmíněna motivace pro práci s multimédii ve výpočetní technice. Dále jsou vyjmenovány kategorie výzkumu rozpoznávání řeči na Fakultě informačních technologií. Velká pozornost je věnována popisu multimediálního prohlížeče, který slouží pro testování a prezentaci technologií rozpoznávačů a v budoucnu se předpokládá jeho využití i jako studijní pomůcky nebo přehrávače pro běžné uživatele. Jsou zde definovány požadované vlastnosti tohoto přehrávače, návrhy a popis jejich realizace, potažmo celé architektury přehrávače, založené na C++, wxWidgets, XML i HTTP.
The core of my work is a browser upgrade, which contains user based transcript-correction from speech recognizer, including creation of transcription storage and sharing server. Introduction of my work mentions motivation for multimodal usage in computer science sphere. Further in text is list of speech recognition reasearch categories from Faculty of Information Technology. The main attention is given to description of multimodal browser used for browser technology testing and presentation. In future, the multimodal browser is supposed to be used as a study-utility or common user multimodal player. Required features of this player, concepts, realization description and whole C++, wxWidgets, XML, HTTP based architecture is defined.
Klíčová slova:
C++; multimediální prohlížeč; MySQL; opravy chyb v přepisech; PHP; rozpoznávání plynulé řeči; síťová komunikace; textové přepisy ke zvukovému záznamu; webové technologie; wxWidgets; C++; multimodal browser; MySQL; PHP; speech recognizer; text trancription of sound record; trancription mistakes correction; web comunication; web technologies; wxWidgets
Instituce: Vysoké učení technické v Brně
(web)
Informace o dostupnosti dokumentu:
Plný text je dostupný v Digitální knihovně VUT. Původní záznam: http://hdl.handle.net/11012/54570