|
Odezírání ze rtů pomocí hlubokých neuronových sítí
Kadleček, Josef ; Kišš, Martin (oponent) ; Hradiš, Michal (vedoucí práce)
Tato práce se zabývá současnými metodami pro přepis řeči na text a odezírání ze rtů za pomoci neuronových sítí. Následně se zabývá podobností architektur neuronových sítí operujících nad zvukem a videem při rozpoznávání řeči a porovnává dostupné audiovizuální datové sady. Výsledkem práce je sada experimentů porovnávající různé zásahy do modelu a jejich dopad na výsledky. Dále je součástí implementace systému pro přepis řeči (CER: 12.6 %) a pro odezírání ze rtů (CER: 57,7 %). Architektury obou systémů jsou založeny na extrakci příznaků pomocí konvolučních vrstev. Za nimi následují rekurentní vrstvy LSTM, další řada konvolučních vrstev a hodnotící funkce CTC.
|
|
Detekce témat z mluvené řeči
Škeřík, Zdeněk ; Szőke, Igor (oponent) ; Schwarz, Petr (vedoucí práce)
Tato bakalářská práce se zabývá detekcí témat z mluvené řeči. Zpracováním a převodem mluvené řeči na text se zabývá první část práce. Samotný problém detekce témat je řešen dvěma odlišnými přístupy - strojovým učením a expertním přístupen kladení velmi přesného dotazu na dokument. Obě metody jsou testovány nad sadou dat, statisticky vyhodnoceny a porovnány.
|
|
Diktovací systém pro platformu Android
Horák, Miroslav ; Pešán, Jan (oponent) ; Schwarz, Petr (vedoucí práce)
Cílem této bakalářské práce je vytvořit distribuovaný diktovací systém. Diktování bude probíhat v reálném čase. Klientská část je určena pro platformu Android. Serverová část je určena pro Windows OS. Pro přepis řeči bude využito již existující jádro rozpoznávacího systému.
|
|
Odezírání ze rtů pomocí hlubokých neuronových sítí
Kadleček, Josef ; Kišš, Martin (oponent) ; Hradiš, Michal (vedoucí práce)
Tato práce se zabývá současnými metodami pro přepis řeči na text a odezírání ze rtů za pomoci neuronových sítí. Následně se zabývá podobností architektur neuronových sítí operujících nad zvukem a videem při rozpoznávání řeči a porovnává dostupné audiovizuální datové sady. Výsledkem práce je sada experimentů porovnávající různé zásahy do modelu a jejich dopad na výsledky. Dále je součástí implementace systému pro přepis řeči (CER: 12.6 %) a pro odezírání ze rtů (CER: 57,7 %). Architektury obou systémů jsou založeny na extrakci příznaků pomocí konvolučních vrstev. Za nimi následují rekurentní vrstvy LSTM, další řada konvolučních vrstev a hodnotící funkce CTC.
|
|
Diktovací systém pro platformu Android
Horák, Miroslav ; Pešán, Jan (oponent) ; Schwarz, Petr (vedoucí práce)
Cílem této bakalářské práce je vytvořit distribuovaný diktovací systém. Diktování bude probíhat v reálném čase. Klientská část je určena pro platformu Android. Serverová část je určena pro Windows OS. Pro přepis řeči bude využito již existující jádro rozpoznávacího systému.
|
|
Detekce témat z mluvené řeči
Škeřík, Zdeněk ; Szőke, Igor (oponent) ; Schwarz, Petr (vedoucí práce)
Tato bakalářská práce se zabývá detekcí témat z mluvené řeči. Zpracováním a převodem mluvené řeči na text se zabývá první část práce. Samotný problém detekce témat je řešen dvěma odlišnými přístupy - strojovým učením a expertním přístupen kladení velmi přesného dotazu na dokument. Obě metody jsou testovány nad sadou dat, statisticky vyhodnoceny a porovnány.
|