Název:
Mining of Textual Data from the Web for Speech Recognition
Překlad názvu:
Mining of Textual Data from the Web for Speech Recognition
Autoři:
Kubalík, Jakub ;
Plchot, Oldřich (oponent) ;
Mikolov, Tomáš (vedoucí práce)
Typ dokumentu: Diplomové práce
Rok:
2010
Jazyk:
eng
Nakladatel: Vysoké učení technické v Brně. Fakulta informačních technologií
Abstrakt: [eng] [cze]
Prvotním cílem tohoto projektu bylo prostudovat problematiku jazykového modelování pro rozpoznávání řeči a techniky pro získávání textových dat z Webu. Text představuje základní techniky rozpoznávání řeči a detailněji popisuje jazykové modely založené na statistických metodách. Zvláště se práce zabývá kriterii pro vyhodnocení kvality jazykových modelů a systémů pro rozpoznávání řeči. Text dále popisuje modely a techniky dolování dat, zvláště vyhledávání informací. Dále jsou představeny problémy spojené se získávání dat z webu, a v kontrastu s tím je představen vyhledávač Google. Součástí projektu byl návrh a implementace systému pro získávání textu z webu, jehož detailnímu popisu je věnována náležitá pozornost. Nicméně, hlavním cílem práce bylo ověřit, zda data získaná z Webu mohou mít nějaký přínos pro rozpoznávání řeči. Popsané techniky se tak snaží najít optimální způsob, jak data získaná z Webu použít pro zlepšení ukázkových jazykových modelů, ale i modelů nasazených v reálných rozpoznávacích systémech.
The preliminary goals of this project were to get familiar with language modeling for speech recognition and techniques for acquisition of text data from the Web. Speech recognition techniques are introduced and statistical language modeling is described in detail. The text also covers mining models and techniques, information retrieval especially. Specific problems of Web mining are discussed and Google search is introduced. Special attention was paid to detailed description of implementation of the text mining system. However, the main goal of this work was to determine, whether the data acquired from the Web can provide some improvement into the recognition systems. The text is describing experiments, which use the retrieved Web data to update sample language models.
Klíčová slova:
A-priori probability ;
Annotation data ;
Bayes' probability theory ;
Corpus ;
Cross-entropy ;
Data mining ;
Entropy ;
Equivalence classification ;
Google's PageRank ;
Information retrieval ;
Information Theory ;
Language model ;
Large Vocabulary Continuous Speech Recognition (LVCSR) ;
Linear Interpolation ;
N-gram ;
Out of Vocabulary rate ;
Perplexity ;
Smoothing ;
Speech recognition ;
Text mining ;
TF-IDF ;
Web mining ;
Word Error Rate ;
Anotační data ;
Apriorní pravděpodobnost ;
Bayesova teorie pravděpodobnosti ;
Dolování dat ;
Dolování textu ;
Dolování webu ;
Entropie ;
Google PageRank ;
Jazykový model ;
Klasifikace do ekvivalentních tříd ;
Korpus ;
Lineární interpolace ;
N-gram ;
Perplexity ;
Podíl OOV slov ;
Rozpoznávání spojité řeči s velkým slovníkem ;
Rozpoznávání řeči ;
Smoothing ;
TF-IDF váha ;
Vyhledávání informací ;
Word Error Rate
Instituce: Vysoké učení technické v Brně
(
web )
Informace o dostupnosti dokumentu:
Plný text je dostupný v Digitální knihovně VUT.
Původní záznam: http://hdl.handle.net/11012/54313
Trvalý odkaz NUŠL: http://www.nusl.cz/ntk/nusl-581208
Záznam je zařazen do těchto sbírek: Školství > Veřejné vysoké školy > Vysoké učení technické v Brně Vysokoškolské kvalifikační práce > Diplomové práce