Original title:
Detekce logopedických vad v řeči
Translated title:
Detection of Logopaedic Defects in Speech
Authors:
Pešek, Milan ; Smékal, Zdeněk (referee) ; Atassi, Hicham (advisor) Document type: Master’s theses
Year:
2009
Language:
cze Publisher:
Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií Abstract:
[cze][eng]
Tato práce se zabývá návrhem a realizací softwarového nástroje pro detekci logopedických vad v řeči. Jelikož je třeba odhalit logopedické vady v řeči co nejdříve, je tento nástroj zaměřen na mluvčí dětského věku. Úvodem text popisuje teorii vytváření řeči, modelování vytváření řeči pro její číslicové zpracování, fonetiku, logopedii a základní logopedické vady v řeči. Dále jsou popsány použité metody pro extrakci příznaků, pro segmentaci slov na hlásky a pro klasifikaci příznaků do tříd vadné a správné výslovnosti. V závěru textu jsou uvedeny výsledky testování vybraných metod. K rozpoznání logopedických vad v řeči jsou použity algoritmy pro extrakci příznaků MFCC (Melovské kepstrální koeficienty) a PLP (Perceptivní lineární predikce). Segmentace slova na hlásky je provedena pomocí metody sledování rozdílnosti příznaků. Extrahované příznaky hlásky jsou klasifikovány do tříd vadné nebo správné výslovnosti jednou z testovaných metod rozpoznání vzoru. Pro klasifikaci příznaků jsou testovány metody k-NN (Algoritmus k-nejbližších sousedů), SVM (Algoritmy podpůrného učení), ANN (Umělé neuronové sítě) a GMM (Smíšené Gaussovy modely).
The thesis deals with a design and an implementation of software for a detection of logopaedia defects of speech. Due to the need of early logopaedia defects detecting, this software is aimed at a child’s age speaker. The introductory part describes the theory of speech realization, simulation of speech realization for numerical processing, phonetics, logopaedia and basic logopaedia defects of speech. There are also described used methods for feature extraction, for segmentation of words to speech sounds and for features classification into either correct or incorrect pronunciation class. In the next part of the thesis there are results of testing of selected methods presented. For logopaedia speech defects recognition algorithms are used in order to extract the features MFCC and PLP. The segmentation of words to speech sounds is performed on the base of Differential Function method. The extracted features of a sound are classified into either a correct or an incorrect pronunciation class with one of tested methods of pattern recognition. To classify the features, the k-NN, SVN, ANN, and GMM methods are tested.
Keywords:
ANN (Artificial neural network); feature extraction; GMM (Gaussian Mixture Models).; k-NN (k-nearest neighbors algorithm); logopaedia defect; MFCC (Mel-frequency cepstral coefficients); pattern recognition; PLP (Perceptual linear prediction); segmentation of words; Speech; SVM (Support vector machines); ANN (Umělé neuronové sítě); extrakce příznaků; GMM (Smíšené Gaussovy modely).; k-NN (metoda k-nejbližších sousedů; logopedická vada; MFCC (Melovské kepstrální koeficienty); PLP (Perceptivní lineární predikce); rozpoznání vzoru; segmentace slov; SVM (Algoritmy podpůrného učení); Řeč
Institution: Brno University of Technology
(web)
Document availability information: Fulltext is available in the Brno University of Technology Digital Library. Original record: http://hdl.handle.net/11012/10248