Národní úložiště šedé literatury Nalezeno 36 záznamů.  předchozí11 - 20dalšíkonec  přejít na záznam: Hledání trvalo 0.01 vteřin. 
Odstranění známého signálu z nahrávky
Hošek, Pavel ; Žmolíková, Kateřina (oponent) ; Černocký, Jan (vedoucí práce)
Cílem této bakalářské práce je návrh a implementace metody, která z audio nahrávky odstraní známý signál. V úvodní části práce je shrnuta teorie o vlastnostech zvuku, základech zpracování signálu a  o identifikaci  systému. Následně jsou představena data  a je uvedeno jakým způsobem bude probíhat testování. Dále je popsán vývoj metody pro odstranění známého signálu z nahrávky. Na závěr jsou pak provedeny experimenty , které zahrnují i porovnání vybraných metod. Nejlepší metody dosahovaly poměrně kvalitních výsledků a známý signál většinou dokázaly  v dostatečné míře odstranit.
Adversarial Augmentation for Robust Speech Separation
Pavlus, Ján ; Černocký, Jan (oponent) ; Žmolíková, Kateřina (vedoucí práce)
Speech separation is the task of separating single signals from the given mixture of multiple speakers. Neural networks trained for speech separation usually work well on artificial data but they often fail on real-world examples. To improve their behavior on real-world mixtures it is possible to use training data augmentations such as noise addition. Nevertheless, the power of these augmentations is limited as they have to be manually designed.     In this work, the modified version of the generative adversarial networks (GAN) model could improve this process by generating augmentations depending on the separation performance on these data. Speech separation could be then made more robust with each generator and separator training step. This system was subjected to experimentation. During these experiments, the parameters have been tuned to find the best setting that will successfully train the GAN model without collapsing. This setting was found and the most robust model from the training was selected and evaluated. Results show that the separator model trained by the GAN model does not achieve any significant improvement from the original separator model pretrained on the WSJ0-2mix dataset during the testing on the WHAM dataset. Nevertheless, another evaluation shows that the separator model trained by the GAN model is significantly more robust than the original one towards the generated noises.
Odstranění známého signálu z nahrávky
Urbánek, Radomír ; Žmolíková, Kateřina (oponent) ; Černocký, Jan (vedoucí práce)
Cílem této diplomové práce je návrh a implementace metody, která ze zvukové nahrávky dokáže odstranit známý signál. V úvodní části práce jsou popsány vlastnosti zvuku a jeho šíření prostorem, zpracování signálu v počítači a hledání impulsní odezvy systému. Dále je popsán postupný vývoj metody vedoucí k odstranění známého signálu z nahrávky. Následuje popis a implementace této metody. Dále je popsáno, jakým způsobem a na jakých datech bude metoda testována. Na závěr je testování vyhodnoceno, navrženo zlepšení a další možné pokračování práce.
Využití fotonického snímače pro analýzu železniční dopravy
Žilka, Jiří ; Žmolíková, Kateřina (oponent) ; Černocký, Jan (vedoucí práce)
Cílem této práce bylo seznámit se s fotonickými senzory a charakteristikami jejich výstupních signálů. Na základě experimentálně naměřených dat a teoretické analýzy provozních situaci navrhnout postup pro detekci počtu projetých náprav železničních vozidel daným bodem tratě pomocí dat z fotonického systému. Navržené varianty zpracování implementovat ve vhodném programovacím jazyce a ověřit algoritmy na dostupných vzorcích. Získané výsledky zpracování signálů vyhodnotit, ideálně pomocí nezávislého měření nebo nezávislým způsobem zpracování. Vyhodnocení mělo zahrnovat primárně validitu výsledků, ale také výpočetní náročnost a komplexitu zpracování. Na závěr porovnat metody mezi sebou a doporučit další postup vývoje.   Přidanou hodnotou práce je prozkoumání možnosti určení směru a rychlosti projíždění, případně dalších informací jako jsou nerovnoměrné rozložení nákladu a hmotnost vozů.
Separace mluvčích v časové doméně pomocí neuronové sítě
Peška, Jiří ; Černocký, Jan (oponent) ; Žmolíková, Kateřina (vedoucí práce)
Práce se zabývá využitím konvolučních neuronových sítí pro automatickou separaci mluvčích v akustickém prostředí. Cílem je implementovat neuronovou síť podle architektury TasNet za použití frameworku PyTorch, natrénovat síť s různými hodnotami hyperparametrů a porovnat kvalitu separací vzhledem k velikosti síťě.   Architektura oproti dosavadním metodám, které převáděly vstupní směs do časově-frekvenční reprezentace, používá konvoluční autoenkodér, který vstupní směs převádí do nezáporné reprezentace, která je optimalizovaná pro extrakci jednotlivých mluvčích. Samotné separace je docíleno aplikací masek, které jsou odhadnuty v separačním modulu. Modul tvoří opakující se posloupnost konvolučních bloků se zvyšující se dilatací, která napomáhá k modelování časových závislostí ve zpracovávané směsi.   K vyhodnocení přesnosti byly použity metriky signal to distortion ratio (SDR), dále perceptual evaluation of speech quality (PESQ) a short-time objective intelligibility (STOI). Trénování a vyhodnocování proběhlo za použití Wall Street Journal datasetu (WSJ0). Natrénováním několika modelů s různými hodnotami hyperparametrů bylo možno pozorovat závislost mezi velikostí sítě a hodnotou SDR. Zatímco menší síť dosahovala, po 60 epochách trénování, přesnosti 10.8 dB, větší síť dosahovala až 12.71 dB.
Akustická detekce pozice řečníka pomocí mikrofonního pole
Chu, Yen Nhi ; Žmolíková, Kateřina (oponent) ; Szőke, Igor (vedoucí práce)
Cílem této práce je vytvořit systém umožňující detekci pozice řečníka v uzavřené místnosti opatřené mikrofonním polem. Přičemž se zabývá dvěma algoritmy pro lokalizaci zdroje zvuku, jmenovitě metodou tvarování přijímací charakteristiky a metodou časových zpoždění. Dané metody byly implementovány na poskytnutý hardware, spolehlivost metod otestována a výsledky byly vyhodnoceny. Výsledky ukázaly, že obě použité metody jsou poměrně přesné, pokud jsou použity v malém prostoru (přibližně 3×3 m). Nedostatky použitého řešení jsou podrobně rozebrány a jsou navržena možná vylepšení. Dané řešení je použitelné jako základ pro tvorbu vestavěných systémů, které budou moci určit polohu zdroje zvuku
Far-Field Speech Recognition
Žmolíková, Kateřina ; Malenovský, Vladimír (oponent) ; Černocký, Jan (vedoucí práce)
The accuracy of speech recognition systems today is very high. However, when speech is captured by a far-field microphone, it can be severely distorted by noise and reverberation and the performance of speech recognition degrades significantly. One way to alleviate this problem is to use microphone arrays. This thesis addresses the methods of combining signals from multiple microphones to improve the quality of the signal and final speech recognition accuracy. It summarizes the theory of speech recognition and the most popular techniques for array processing. Afterwards, it demonstrates and analyzes the results obtained by two different methods for beamforming and a method for dereverberation of multichannel signals. Finally, it examines an alternative way of performing beamforming using neural networks.
Sada počítačových cvičení pro Signály a systémy
Pálka, Petr ; Žmolíková, Kateřina (oponent) ; Černocký, Jan (vedoucí práce)
Cílem této práce je transformovat současný formát materiálů k počítačovým cvičení z předmětu Signály a Systémy do prostředí Jupyter. Dosavadní materiály jsou členěny podle témat do jednotlivých PDF souborů, které obsahují relevantní teorii a ukázky MATLAB kódu. Tematické okruhy se zabývají základy digitálního zpracování signálů na počítači. Vytvořené Jupyter notebooky obsahují teoretickou oporu z originální předlohy ve formátu Markdown + LaTeX a~původní implementace pro prostředí MATLAB je zde převedena do jazyka Python. Tyto materiály navíc přímo prezentují výstupy Python kódu typu graf, přehratelné audio, text, obrázek nebo jejich interaktivní kombinace.
Sada počítačových cvičení pro Signály a systémy
Pálka, Petr ; Žmolíková, Kateřina (oponent) ; Černocký, Jan (vedoucí práce)
Cílem této práce je transformovat současný formát materiálů k počítačovým cvičení z předmětu Signály a Systémy do prostředí Jupyter. Dosavadní materiály jsou členěny podle témat do jednotlivých PDF souborů, které obsahují relevantní teorii a ukázky MATLAB kódu. Tematické okruhy se zabývají základy digitálního zpracování signálů na počítači. Vytvořené Jupyter notebooky obsahují teoretickou oporu z originální předlohy ve formátu Markdown + LaTeX a~původní implementace pro prostředí MATLAB je zde převedena do jazyka Python. Tyto materiály navíc přímo prezentují výstupy Python kódu typu graf, přehratelné audio, text, obrázek nebo jejich interaktivní kombinace.
Adversarial Augmentation for Robust Speech Separation
Pavlus, Ján ; Černocký, Jan (oponent) ; Žmolíková, Kateřina (vedoucí práce)
Speech separation is the task of separating single signals from the given mixture of multiple speakers. Neural networks trained for speech separation usually work well on artificial data but they often fail on real-world examples. To improve their behavior on real-world mixtures it is possible to use training data augmentations such as noise addition. Nevertheless, the power of these augmentations is limited as they have to be manually designed.     In this work, the modified version of the generative adversarial networks (GAN) model could improve this process by generating augmentations depending on the separation performance on these data. Speech separation could be then made more robust with each generator and separator training step. This system was subjected to experimentation. During these experiments, the parameters have been tuned to find the best setting that will successfully train the GAN model without collapsing. This setting was found and the most robust model from the training was selected and evaluated. Results show that the separator model trained by the GAN model does not achieve any significant improvement from the original separator model pretrained on the WSJ0-2mix dataset during the testing on the WHAM dataset. Nevertheless, another evaluation shows that the separator model trained by the GAN model is significantly more robust than the original one towards the generated noises.

Národní úložiště šedé literatury : Nalezeno 36 záznamů.   předchozí11 - 20dalšíkonec  přejít na záznam:
Chcete být upozorněni, pokud se objeví nové záznamy odpovídající tomuto dotazu?
Přihlásit se k odběru RSS.