Original title:
Hledání akustických vzorů v řečových datech bez rozpoznávání
Translated title:
Searching Acoustic Patterns in Speech Data without Recognition
Authors:
Skácel, Miroslav ; Fapšo, Michal (referee) ; Černocký, Jan (advisor) Document type: Bachelor's theses
Year:
2012
Language:
cze Publisher:
Vysoké učení technické v Brně. Fakulta informačních technologií Abstract:
[cze][eng]
Tato práce se zabývá metodami vyhledávání slov, slovních frází a delších úseků v rozsáhlých řečových datech bez předchozích znalostí těchto dat. V úvodu je seznámení s danou problematikou a principy moderních metod pro vyhledávání opakujících se objektů. Dále je popsána reprezentace a segmentace vstupních dat, techniky pro vyhledání objektu v mluveném projevu a popis modelování nalezených objektů. Následně je popsána metoda pro vyhledávání objektů podle předem defi novaného vzoru. V dalším kroku jsou defi nována data pro experimenty, ve kterých byly použity metody pro detekci mluvených výrazů podle vzoru. Následuje popis systémových požadavků. V závěru je zhodnocení práce a návrhy na další vývoj.
This work investigates into methods for words, word phrases and longer segments detection in large speech data sets in an unsupervised way. At first, basics for the given topic and principles of modern methods for searching of repeating objects are introduced. The representation and segmentation of the input data are described. Techniques for object detection in speech are presented. The description of found motifs modelling follows. The next step defi nes data sets for experiments in which spoken term detection by an example is performed. The system requirements are described. In the conclusion, the work is summarised and suggestions for further development are discussed.
Keywords:
acoustic pattern search; DTW; dynamic time warping; Query-by-Example; seeded motif discovery; speech data segmentation; unsupervised learning; word detection; detekce slov; dotaz vzorem; DTW; dynamické borcení času; hledání akustických vzorů; nalezení motivu ze semínka; segmentace řečových dat; učení bez učitele
Institution: Brno University of Technology
(web)
Document availability information: Fulltext is available in the Brno University of Technology Digital Library. Original record: http://hdl.handle.net/11012/55160