Žmolíková, Kateřina - Výsledky hledání - Digitální repozitář

host :: přihlásit Digitální repozitář
		Hledej		Nový záznam		Nápověda		O repozitáři

Hlavní stránka > Výsledky hledání: Žmolíková, Kateřina

Hledej:

Tipy pro vyhledávaní :: Rozšířené hledání

Hledej ve sbírkách:

Seřadit podle:	Zobrazit výsledky:	Výstupní formát:

	Odstranění známého signálu z nahrávky Hošek, Pavel ; Žmolíková, Kateřina (oponent) ; Černocký, Jan (vedoucí práce) Cílem této bakalářské práce je návrh a implementace metody, která z audio nahrávky odstraní známý signál. V úvodní části práce je shrnuta teorie o vlastnostech zvuku, základech zpracování signálu a o identifikaci systému. Následně jsou představena data a je uvedeno jakým způsobem bude probíhat testování. Dále je popsán vývoj metody pro odstranění známého signálu z nahrávky. Na závěr jsou pak provedeny experimenty , které zahrnují i porovnání vybraných metod. Nejlepší metody dosahovaly poměrně kvalitních výsledků a známý signál většinou dokázaly v dostatečné míře odstranit. Úplný záznam
	Adversarial Augmentation for Robust Speech Separation Pavlus, Ján ; Černocký, Jan (oponent) ; Žmolíková, Kateřina (vedoucí práce) Speech separation is the task of separating single signals from the given mixture of multiple speakers. Neural networks trained for speech separation usually work well on artificial data but they often fail on real-world examples. To improve their behavior on real-world mixtures it is possible to use training data augmentations such as noise addition. Nevertheless, the power of these augmentations is limited as they have to be manually designed. In this work, the modified version of the generative adversarial networks (GAN) model could improve this process by generating augmentations depending on the separation performance on these data. Speech separation could be then made more robust with each generator and separator training step. This system was subjected to experimentation. During these experiments, the parameters have been tuned to find the best setting that will successfully train the GAN model without collapsing. This setting was found and the most robust model from the training was selected and evaluated. Results show that the separator model trained by the GAN model does not achieve any significant improvement from the original separator model pretrained on the WSJ0-2mix dataset during the testing on the WHAM dataset. Nevertheless, another evaluation shows that the separator model trained by the GAN model is significantly more robust than the original one towards the generated noises. Úplný záznam
	Odstranění známého signálu z nahrávky Urbánek, Radomír ; Žmolíková, Kateřina (oponent) ; Černocký, Jan (vedoucí práce) Cílem této diplomové práce je návrh a implementace metody, která ze zvukové nahrávky dokáže odstranit známý signál. V úvodní části práce jsou popsány vlastnosti zvuku a jeho šíření prostorem, zpracování signálu v počítači a hledání impulsní odezvy systému. Dále je popsán postupný vývoj metody vedoucí k odstranění známého signálu z nahrávky. Následuje popis a implementace této metody. Dále je popsáno, jakým způsobem a na jakých datech bude metoda testována. Na závěr je testování vyhodnoceno, navrženo zlepšení a další možné pokračování práce. Úplný záznam
	Využití fotonického snímače pro analýzu železniční dopravy Žilka, Jiří ; Žmolíková, Kateřina (oponent) ; Černocký, Jan (vedoucí práce) Cílem této práce bylo seznámit se s fotonickými senzory a charakteristikami jejich výstupních signálů. Na základě experimentálně naměřených dat a teoretické analýzy provozních situaci navrhnout postup pro detekci počtu projetých náprav železničních vozidel daným bodem tratě pomocí dat z fotonického systému. Navržené varianty zpracování implementovat ve vhodném programovacím jazyce a ověřit algoritmy na dostupných vzorcích. Získané výsledky zpracování signálů vyhodnotit, ideálně pomocí nezávislého měření nebo nezávislým způsobem zpracování. Vyhodnocení mělo zahrnovat primárně validitu výsledků, ale také výpočetní náročnost a komplexitu zpracování. Na závěr porovnat metody mezi sebou a doporučit další postup vývoje. Přidanou hodnotou práce je prozkoumání možnosti určení směru a rychlosti projíždění, případně dalších informací jako jsou nerovnoměrné rozložení nákladu a hmotnost vozů. Úplný záznam
	Separace mluvčích v časové doméně pomocí neuronové sítě Peška, Jiří ; Černocký, Jan (oponent) ; Žmolíková, Kateřina (vedoucí práce) Práce se zabývá využitím konvolučních neuronových sítí pro automatickou separaci mluvčích v akustickém prostředí. Cílem je implementovat neuronovou síť podle architektury TasNet za použití frameworku PyTorch, natrénovat síť s různými hodnotami hyperparametrů a porovnat kvalitu separací vzhledem k velikosti síťě. Architektura oproti dosavadním metodám, které převáděly vstupní směs do časově-frekvenční reprezentace, používá konvoluční autoenkodér, který vstupní směs převádí do nezáporné reprezentace, která je optimalizovaná pro extrakci jednotlivých mluvčích. Samotné separace je docíleno aplikací masek, které jsou odhadnuty v separačním modulu. Modul tvoří opakující se posloupnost konvolučních bloků se zvyšující se dilatací, která napomáhá k modelování časových závislostí ve zpracovávané směsi. K vyhodnocení přesnosti byly použity metriky signal to distortion ratio (SDR), dále perceptual evaluation of speech quality (PESQ) a short-time objective intelligibility (STOI). Trénování a vyhodnocování proběhlo za použití Wall Street Journal datasetu (WSJ0). Natrénováním několika modelů s různými hodnotami hyperparametrů bylo možno pozorovat závislost mezi velikostí sítě a hodnotou SDR. Zatímco menší síť dosahovala, po 60 epochách trénování, přesnosti 10.8 dB, větší síť dosahovala až 12.71 dB. Úplný záznam
	Akustická detekce pozice řečníka pomocí mikrofonního pole Chu, Yen Nhi ; Žmolíková, Kateřina (oponent) ; Szőke, Igor (vedoucí práce) Cílem této práce je vytvořit systém umožňující detekci pozice řečníka v uzavřené místnosti opatřené mikrofonním polem. Přičemž se zabývá dvěma algoritmy pro lokalizaci zdroje zvuku, jmenovitě metodou tvarování přijímací charakteristiky a metodou časových zpoždění. Dané metody byly implementovány na poskytnutý hardware, spolehlivost metod otestována a výsledky byly vyhodnoceny. Výsledky ukázaly, že obě použité metody jsou poměrně přesné, pokud jsou použity v malém prostoru (přibližně 3×3 m). Nedostatky použitého řešení jsou podrobně rozebrány a jsou navržena možná vylepšení. Dané řešení je použitelné jako základ pro tvorbu vestavěných systémů, které budou moci určit polohu zdroje zvuku Úplný záznam
	Far-Field Speech Recognition Žmolíková, Kateřina ; Malenovský, Vladimír (oponent) ; Černocký, Jan (vedoucí práce) The accuracy of speech recognition systems today is very high. However, when speech is captured by a far-field microphone, it can be severely distorted by noise and reverberation and the performance of speech recognition degrades significantly. One way to alleviate this problem is to use microphone arrays. This thesis addresses the methods of combining signals from multiple microphones to improve the quality of the signal and final speech recognition accuracy. It summarizes the theory of speech recognition and the most popular techniques for array processing. Afterwards, it demonstrates and analyzes the results obtained by two different methods for beamforming and a method for dereverberation of multichannel signals. Finally, it examines an alternative way of performing beamforming using neural networks. Úplný záznam
	Sada počítačových cvičení pro Signály a systémy Pálka, Petr ; Žmolíková, Kateřina (oponent) ; Černocký, Jan (vedoucí práce) Cílem této práce je transformovat současný formát materiálů k počítačovým cvičení z předmětu Signály a Systémy do prostředí Jupyter. Dosavadní materiály jsou členěny podle témat do jednotlivých PDF souborů, které obsahují relevantní teorii a ukázky MATLAB kódu. Tematické okruhy se zabývají základy digitálního zpracování signálů na počítači. Vytvořené Jupyter notebooky obsahují teoretickou oporu z originální předlohy ve formátu Markdown + LaTeX a~původní implementace pro prostředí MATLAB je zde převedena do jazyka Python. Tyto materiály navíc přímo prezentují výstupy Python kódu typu graf, přehratelné audio, text, obrázek nebo jejich interaktivní kombinace. Úplný záznam
	Sada počítačových cvičení pro Signály a systémy Pálka, Petr ; Žmolíková, Kateřina (oponent) ; Černocký, Jan (vedoucí práce) Cílem této práce je transformovat současný formát materiálů k počítačovým cvičení z předmětu Signály a Systémy do prostředí Jupyter. Dosavadní materiály jsou členěny podle témat do jednotlivých PDF souborů, které obsahují relevantní teorii a ukázky MATLAB kódu. Tematické okruhy se zabývají základy digitálního zpracování signálů na počítači. Vytvořené Jupyter notebooky obsahují teoretickou oporu z originální předlohy ve formátu Markdown + LaTeX a~původní implementace pro prostředí MATLAB je zde převedena do jazyka Python. Tyto materiály navíc přímo prezentují výstupy Python kódu typu graf, přehratelné audio, text, obrázek nebo jejich interaktivní kombinace. Úplný záznam
	Adversarial Augmentation for Robust Speech Separation Pavlus, Ján ; Černocký, Jan (oponent) ; Žmolíková, Kateřina (vedoucí práce) Speech separation is the task of separating single signals from the given mixture of multiple speakers. Neural networks trained for speech separation usually work well on artificial data but they often fail on real-world examples. To improve their behavior on real-world mixtures it is possible to use training data augmentations such as noise addition. Nevertheless, the power of these augmentations is limited as they have to be manually designed. In this work, the modified version of the generative adversarial networks (GAN) model could improve this process by generating augmentations depending on the separation performance on these data. Speech separation could be then made more robust with each generator and separator training step. This system was subjected to experimentation. During these experiments, the parameters have been tuned to find the best setting that will successfully train the GAN model without collapsing. This setting was found and the most robust model from the training was selected and evaluated. Results show that the separator model trained by the GAN model does not achieve any significant improvement from the original separator model pretrained on the WSJ0-2mix dataset during the testing on the WHAM dataset. Nevertheless, another evaluation shows that the separator model trained by the GAN model is significantly more robust than the original one towards the generated noises. Úplný záznam

Chcete být upozorněni, pokud se objeví nové záznamy odpovídající tomuto dotazu?
Přihlásit se k odběru RSS.

Digitální repozitář :: :: :: ::
Powered by v1.1.2
Spravuje

Tato stránka je dostupná také v následujících jazycích:
Česky English