|
Adaptace systémů pro rozpoznání mluvčího
Novotný, Ondřej ; Pešán, Jan (oponent) ; Plchot, Oldřich (vedoucí práce)
V této práci navrhneme techniky adaptace systémů na rozpoznávání řeči. Cílem je vytvořit techniku adaptace Pravděpodobnostní lineární diskriminační analýzy. Zaměříme se na adap-taci bez učitele. Naše testy ukáží vhodné shlukovací techniky pro odhad identity mluvčích a vhodné techniky na odhad počtu mluvčích v adaptační datové sadě. Experimenty jsou prováděny na korpusech NIST a Switchboard.
|
|
Diktovací systém pro platformu Android
Horák, Miroslav ; Pešán, Jan (oponent) ; Schwarz, Petr (vedoucí práce)
Cílem této bakalářské práce je vytvořit distribuovaný diktovací systém. Diktování bude probíhat v reálném čase. Klientská část je určena pro platformu Android. Serverová část je určena pro Windows OS. Pro přepis řeči bude využito již existující jádro rozpoznávacího systému.
|
|
Application of Mean Normalized Stochastic Gradient Descent for Speech Recognition
Klusáček, Jan ; Hradiš, Michal (oponent) ; Pešán, Jan (vedoucí práce)
The artificial neural networks are on the rise in recent years. One possible optimization technique is mean-normalized stochastic gradient descent recently proposes by Wiesler et al. [1]. This work further explains and examines this method on phoneme classification task. Not all findings of Wiesler et al. can be confirmed. The mean-normalized SGD is helpful only if the network is large enough (but not too deep) and if the sigmoid non-linear function is used. Otherwise, the mean-normalized SGD slightly impairs the network performance and therefore cannot be recommended as a general optimization technique. [1] Simon Wiesler, Alexander Richard, Ralf Schluter, and Hermann Ney. Mean-normalized stochastic gradient for large-scale deep learning. In Acoustics, Speech and Signal Processing (ICASSP), 2014 IEEE International Conference on, pages 180{184. IEEE, 2014.
|
|
Odemykání brány hlasem
Bauer, Jan ; Pešán, Jan (oponent) ; Schwarz, Petr (vedoucí práce)
Cílem této práce je vytvoření zařízení pro autentizaci řečníka podle hlasu. V řešení je použito knihovny BSAPI, která byla vyvinuta společností Phonexia. Knihovna je napsána v jazyce C++ a byla portována na zařízení Raspberry Pi B+. Správný chod je zajištěn skriptem napsaným v jazyce Python. Vytvořené řešení je určitě zajímavé a může se v budoucnu stát spolehlivým bezpečnostním systémem.
|
|
Predikce deště z meteoradaru
Vlček, Michael ; Pešán, Jan (oponent) ; Szőke, Igor (vedoucí práce)
Tato práce se zabývá předpovědí počasí s využitím meteoradarových snímků a některých dalších souvisejících faktorů prostřednictvím výpočetního modelu neuronové sítě. Klade si za cíl prozkoumat možnosti predikce pomocí tohoto modelu a experimentálně stanovit co nejúspěšnější konfiguraci modelu pro vykonávání vybrané činnosti.
|