Národní úložiště šedé literatury Nalezeno 36 záznamů.  začátekpředchozí27 - 36  přejít na záznam: Hledání trvalo 0.00 vteřin. 
Recognition of Multi-Talker Overlapping Speech Using Neural Networks
Hradil, Jaromír ; Švec, Ján (oponent) ; Žmolíková, Kateřina (vedoucí práce)
This work deals with the speech recognition of overlapping speakers using a neural network. It examines the problem of speech recognition from multiple speakers and the ways in which this problem is solved. Specifically, in addition to traditional components such as convolutional neural networks, LSTM, etc., it is also an application of special components: attention mechanism and gated convolution. And also the application of a technique called permutation invariant training. Part of this work is to apply these approaches to assigned training data, which consists of artificially created mixtures of two speakers reading articles from the Wall Street Journal. The next step was to train the respective architectures using the combinations of the elements mentioned above. The models in this work replace the acoustic model. There were two architectures using different types of attention mechanism and one without it. Experiments have shown that architectures using the attention mechanism in this type of task have not surpassed more traditional architecture by suffering from gated convolution. Nevertheless, they showed potential.
Automatické hodnocení anglické výslovnosti nerodilých mluvčích
Gazdík, Peter ; Szőke, Igor (oponent) ; Žmolíková, Kateřina (vedoucí práce)
Výuka anglickej výslovnosti s využitím počítača sa v súčasnej dobe stáva čoraz viac populárnejšou. Napriek tomu presnosť týchto systémov je stále pomerne nízka. Táto diplomová práca sa preto zameriava na zlepšenie existujúcich metód automatického hodnotenia výslovnosti. V prvej časti práce je uvedený prehľad v súčasnosti používaných techník v tejto oblasti. Následne bol navrhnutý systém využívajúci dva rôzne prístupy. Dosiahnuté výsledky ukazujú znateľné zlepšenie oproti referenčnému systému.
Automatizovaná detekce ofenzivního jazyka a nenávistných projevů v přirozeném jazyce
Štajerová, Alžbeta ; Žmolíková, Kateřina (oponent) ; Fajčík, Martin (vedoucí práce)
Táto práca sa zaoberá fenoménom nenávistných prejavov a ofenzívneho jazyka, ich definíciami a detekciou. Popisuje metódy doterajšieho riešenia detekcie. Zhodnocuje dostupné dátové sady využiteľné pri trénovaní modelov zameraných na detekciu tohto fenoménu. Dáva si za cieľ uviesť ďalšie metódy riešenia detekcie tohto problému a porovnanie ich výsledkov a vyhodnotenie úspešnosti. Zvolený problém bol riešený piatimi modelmi. Dva z nich boli zamerané na extrakciu príznakov a ich následnú klasifikáciu. Ďalšie tri boli riešené pomocou neurónových sietí. Úspešnosť implementovaných modelov som experimentálne vyhodnotila. Výsledky tejto práce umožňujú porovnanie typických prístupov s metódami využívajúcimi najnovšie poznatky z oblasti strojového učenia použitých pre klasifikáciu nenávistného a ofenzívneho jazyka.
Akustická detekce pozice řečníka pomocí mikrofonního pole
Chu, Yen Nhi ; Žmolíková, Kateřina (oponent) ; Szőke, Igor (vedoucí práce)
Cílem této práce je vytvořit systém umožňující detekci pozice řečníka v uzavřené místnosti opatřené mikrofonním polem. Přičemž se zabývá dvěma algoritmy pro lokalizaci zdroje zvuku, jmenovitě metodou tvarování přijímací charakteristiky a metodou časových zpoždění. Dané metody byly implementovány na poskytnutý hardware, spolehlivost metod otestována a výsledky byly vyhodnoceny. Výsledky ukázaly, že obě použité metody jsou poměrně přesné, pokud jsou použity v malém prostoru (přibližně 3×3 m). Nedostatky použitého řešení jsou podrobně rozebrány a jsou navržena možná vylepšení. Dané řešení je použitelné jako základ pro tvorbu vestavěných systémů, které budou moci určit polohu zdroje zvuku
Odstranění známého signálu z nahrávky
Hošek, Pavel ; Žmolíková, Kateřina (oponent) ; Černocký, Jan (vedoucí práce)
Cílem této bakalářské práce je návrh a implementace metody, která z audio nahrávky odstraní známý signál. V úvodní části práce je shrnuta teorie o vlastnostech zvuku, základech zpracování signálu a  o identifikaci  systému. Následně jsou představena data  a je uvedeno jakým způsobem bude probíhat testování. Dále je popsán vývoj metody pro odstranění známého signálu z nahrávky. Na závěr jsou pak provedeny experimenty , které zahrnují i porovnání vybraných metod. Nejlepší metody dosahovaly poměrně kvalitních výsledků a známý signál většinou dokázaly  v dostatečné míře odstranit.
Odstranění známého signálu z nahrávky
Urbánek, Radomír ; Žmolíková, Kateřina (oponent) ; Černocký, Jan (vedoucí práce)
Cílem této diplomové práce je návrh a implementace metody, která ze zvukové nahrávky dokáže odstranit známý signál. V úvodní části práce jsou popsány vlastnosti zvuku a jeho šíření prostorem, zpracování signálu v počítači a hledání impulsní odezvy systému. Dále je popsán postupný vývoj metody vedoucí k odstranění známého signálu z nahrávky. Následuje popis a implementace této metody. Dále je popsáno, jakým způsobem a na jakých datech bude metoda testována. Na závěr je testování vyhodnoceno, navrženo zlepšení a další možné pokračování práce.
Změření vlivu akustiky prostředí na úspěšnost rozpoznávače řeči
Paliesek, Jakub ; Žmolíková, Kateřina (oponent) ; Szőke, Igor (vedoucí práce)
Táto bakalárska práca sa venuje sledovaniu vplyvu akustických parametrov na úspešnosť rozpoznávania reči. Použité rozpoznávače sú vyhodnotené na korpusoch Speecon, Temic a LibriSpeech. Porovnávané sú rôzne verzie týchto dát, ktoré vznikli retransmisiou v niekoľkých miestnostiach a umelou retransmisiou pomocou impulzných odoziev. Tie boli vytvorené metódami Exponential sine sweep (ESS) a Maximum length sequence (MLS) pre skutočné miestnosti a tiež pomocou metódy Image source model (ISM), ktorá generuje syntetické impulzné odozvy. Výstupom je porovnanie týchto spôsobov retransmisie. Pre metódu ESS je skúmaná úspešnosť rozpoznávania pre rôzne dĺžky excitačného signálu. Okrem toho je sledovaná závislosť úspešnosti rozpoznávania na vzájomnej polohe zdroja a prijímača, prítomnosti prekážok a smere mikrofónov.
Dereverberace založená na neuronových sítích
Karlík, Pavol ; Černocký, Jan (oponent) ; Žmolíková, Kateřina (vedoucí práce)
V posledných rokoch sa rozrástlo využitie neurónových sietí v oblasti spracovania reči. Táto bakalárska práca sa zaoberá implementáciou a vyhodnocovaním algoritmu na odstránenie dozvuku (reverberácie), ktorý využíva hlboké neurónové siete pre odhad výkonového spektra z rečovej nahrávky. Tento algoritmus je založený na najmodernejšom algoritme, Weighted prediction error (WPE), ktorý dokáže zredukovať reverberáciu z rečovej nahrávky. Táto práca obsahuje sumarizáciu teórie o dereverberácii, neurónových sieťach a algoritme WPE. V tejto práci sa experimentovalo s rôznymi architektúrami neurónových sietí, ktoré následne boli natrénované na rozdielnych dátových sadách s rôznymi vlastnosťami. Výsledky experimentov ukazujú, že naša modifikácia WPE dosahuje lepších výsledkov ako konvenčný algoritmus, a to najmä pre situácie, v ktorých je dĺžka spracovaného signálu krátka.
Far-Field Speech Recognition
Žmolíková, Kateřina ; Malenovský, Vladimír (oponent) ; Černocký, Jan (vedoucí práce)
The accuracy of speech recognition systems today is very high. However, when speech is captured by a far-field microphone, it can be severely distorted by noise and reverberation and the performance of speech recognition degrades significantly. One way to alleviate this problem is to use microphone arrays. This thesis addresses the methods of combining signals from multiple microphones to improve the quality of the signal and final speech recognition accuracy. It summarizes the theory of speech recognition and the most popular techniques for array processing. Afterwards, it demonstrates and analyzes the results obtained by two different methods for beamforming and a method for dereverberation of multichannel signals. Finally, it examines an alternative way of performing beamforming using neural networks.
Rozpoznávání řeči pro leteckou komunikaci
Žmolíková, Kateřina ; Burget, Lukáš (oponent) ; Veselý, Karel (vedoucí práce)
Tato bakalářská práce se zabývá rozpoznáváním řeči. Jejím cílem je postavit systém rozpoznávání řeči založený na neuronových sítích a otestovat jej na nahrávkách letecké komunikace. Výsledný akustický model bude použit v projektu A-PiMod. Postavený systém dosáhl na testovacích datech úspěšnost 29.5% WER. Dalším úkolem práce byly experimenty s neuronovými sítěmi, které jsou součástí akustického modelu. První experimenty zkoumaly možnost jejich zjednodušení a urychlení a dopad na úspěšnost rozpoznávání. Další se zabývaly aktivační funkcí rectifier a také konvolučními neuronovými sítěmi. V experimentech s konvolučními neuronovými sítěmi bylo dosáhnuto 1.5% zlepšení a dosáhly tak o 0.4% lepšího výsledku než plně propojená neuronová síť se stejnou architekturou.

Národní úložiště šedé literatury : Nalezeno 36 záznamů.   začátekpředchozí27 - 36  přejít na záznam:
Chcete být upozorněni, pokud se objeví nové záznamy odpovídající tomuto dotazu?
Přihlásit se k odběru RSS.