Original title: Mining of Textual Data from the Web for Speech Recognition
Translated title: Mining of Textual Data from the Web for Speech Recognition
Authors: Kubalík, Jakub ; Plchot, Oldřich (referee) ; Mikolov, Tomáš (advisor)
Document type: Master’s theses
Year: 2010
Language: eng
Publisher: Vysoké učení technické v Brně. Fakulta informačních technologií
Abstract: [eng] [cze]

Keywords: Anotační data; Apriorní pravděpodobnost; Bayesova teorie pravděpodobnosti; Dolování dat; Dolování textu; Dolování webu; Entropie; Google PageRank; Jazykový model; Klasifikace do ekvivalentních tříd; Korpus; Lineární interpolace; N-gram; Perplexity; Podíl OOV slov; Rozpoznávání spojité řeči s velkým slovníkem; Rozpoznávání řeči; Smoothing; TF-IDF váha; Vyhledávání informací; Word Error Rate; A-priori probability; Annotation data; Bayes' probability theory; Corpus; Cross-entropy; Data mining; Entropy; Equivalence classification; Google's PageRank; Information retrieval; Information Theory; Language model; Large Vocabulary Continuous Speech Recognition (LVCSR); Linear Interpolation; N-gram; Out of Vocabulary rate; Perplexity; Smoothing; Speech recognition; Text mining; TF-IDF; Web mining; Word Error Rate

Institution: Brno University of Technology (web)
Document availability information: Fulltext is available in the Brno University of Technology Digital Library.
Original record: http://hdl.handle.net/11012/54313

Permalink: http://www.nusl.cz/ntk/nusl-237170


The record appears in these collections:
Universities and colleges > Public universities > Brno University of Technology
Academic theses (ETDs) > Master’s theses
 Record created 2016-06-03, last modified 2022-09-04


No fulltext
  • Export as DC, NUŠL, RIS
  • Share