Original title:
Detekce změny jazyka při hovoru
Translated title:
Code Switching Detection in Speech
Authors:
Povolný, Filip ; Glembek, Ondřej (referee) ; Matějka, Pavel (advisor) Document type: Master’s theses
Year:
2015
Language:
cze Publisher:
Vysoké učení technické v Brně. Fakulta informačních technologií Abstract:
[cze][eng]
Tato práce se zabývá problematikou detekce změny jazyka při hovoru. V první části jsou popsány v současnosti používané metody diarizace jazyků. K implementaci byla vybrána metoda založená na akustickém přístupu identifikace jazyka s využitím směsi Gaussovských rozložení, i-vektoru a lineární diskriminační analýzy. Pro experimenty byla vytvořena mandarínsko-anglická databáze se střídáním jazyků. Na této databázi zvolený systém dosahuje úspěšnosti 89,3 % správně klasifikovaných segmentů.
This master's thesis deals with code-switching detection in speech. The state-of-the-art methods of language diarization are described in the first part of the thesis. The proposed method for implementation is based on acoustic approach to language identification using combination of GMM, i-vector and LDA. New Mandarin-English code-switching database was created for these experiments. Using this system, accuracy of 89,3 % is achieved on this database.
Keywords:
code switching; language diarization; language identification; language recognition; diarizace jazyků; identifikace jazyka; rozpoznávání jazyků; střídání kódů
Institution: Brno University of Technology
(web)
Document availability information: Fulltext is available in the Brno University of Technology Digital Library. Original record: http://hdl.handle.net/11012/52214