Národní úložiště šedé literatury Nalezeno 6 záznamů.  Hledání trvalo 0.00 vteřin. 
Redukce šumu audionahrávek pomocí hlubokých neuronových sítí
Talár, Ondřej ; Galáž, Zoltán (oponent) ; Harár, Pavol (vedoucí práce)
Práce se zabývá možností použití hluboké rekurentní neuronové sítě typu Long Short-Term Memory pro robustní odšumování zarušeného signálu. LSTM je v současnosti velice lákavá architektura díky své vlastnosti pamatovat si předchozí váhy, a nebo je upravovat nejen dle použitých algoritmů, ale také zkoumáním změn v sousedních buňkách. V práci je popsán výběr výchozího datasetu a použitých šumů spolu s vytvořením optimálních testovacích dat. Pro trénování sítě je zvolen framework KERAS pro jazyk Python. Jsou prozkoumány a popsány kandidátní sítě pro možné řešení, následně je provedeno několik experimentů pro zjištění skutečného chování neuronové sítě.
Redukce šumu audionahrávek pomocí hlubokých neuronových sítí
Talár, Ondřej ; Galáž, Zoltán (oponent) ; Harár, Pavol (vedoucí práce)
Práce se zabývá možností použití hluboké rekurentní neuronové sítě typu Long Short-Term Memory pro robustní odšumování zarušeného signálu. LSTM je v současnosti velice lákavá architektura díky své vlastnosti pamatovat si předchozí váhy, a nebo je upravovat nejen dle použitých algoritmů, ale také zkoumáním změn v sousedních buňkách. V práci je popsán výběr výchozího datasetu a použitých šumů spolu s vytvořením optimálních testovacích dat. Pro trénování sítě je zvolen framework KERAS pro jazyk Python a jsou prozkoumány a popsány kandidátní sítě pro možné řešení.
Text-to-Speech Personalization
Luner, Michal ; Černocký, Jan (oponent) ; Brukner, Jan (vedoucí práce)
This thesis aims to develop a model that can convert input text written in Czech into speech that closely resembles a target speaker. This work is based on the VITS text-to-speech neural network model. The workflow is as follows: a Czech dataset is acquired, the neural network is trained, the trained model is then used to generate audio samples, which are evaluated using several objective metrics. A personalized dataset is developed and used to fine-tune the model, and the evaluation process is repeated. As a result, two fine-tuned models were developed. The male model achieved a~MOS of 4.12, and the female model achieved a~score of 3.02. The scores prove that a base model fine-tuned using a personalized dataset can achieve results close to the original audio. The contribution of this thesis is, apart from the personalized models, the pipeline for audio evaluation and dataset development, which can be easily adjusted for tasks on different data. In addition, a detailed analysis of best practices applied during the development of new datasets is provided.
Vizuální detekce anomálií v průmyslové výrobě
Lukaszczyk, Jakub ; Petyovský, Petr (oponent) ; Horák, Karel (vedoucí práce)
Práce se zabývá detekcí anomálií v obrazových datech pořízených na průmyslovém výrobku. V první části je nastíněna problematika a přístupy k jejímu řešení pomocí hlubokého učení. Dále jsou rozebrány některé z používaných architektur, které lze pro tuto úlohu použít. V praktické části je poté popsána platforma pro průmyslovou inspekci, použitý software a tvorba vlastního anotovaného datasetu. Poskytnutý software je rozšířen o funkcionalitu pro ovládání platformy a práci s více kamerami. Poslední část se zabývá experimenty, jejichž cílem je zjistit vliv datasetu na výsledný model a odhad jeho výkonnosti. Experimenty vyhodnocují vliv jak v trénovací, tak i v testovací fázi.
Redukce šumu audionahrávek pomocí hlubokých neuronových sítí
Talár, Ondřej ; Galáž, Zoltán (oponent) ; Harár, Pavol (vedoucí práce)
Práce se zabývá možností použití hluboké rekurentní neuronové sítě typu Long Short-Term Memory pro robustní odšumování zarušeného signálu. LSTM je v současnosti velice lákavá architektura díky své vlastnosti pamatovat si předchozí váhy, a nebo je upravovat nejen dle použitých algoritmů, ale také zkoumáním změn v sousedních buňkách. V práci je popsán výběr výchozího datasetu a použitých šumů spolu s vytvořením optimálních testovacích dat. Pro trénování sítě je zvolen framework KERAS pro jazyk Python. Jsou prozkoumány a popsány kandidátní sítě pro možné řešení, následně je provedeno několik experimentů pro zjištění skutečného chování neuronové sítě.
Redukce šumu audionahrávek pomocí hlubokých neuronových sítí
Talár, Ondřej ; Galáž, Zoltán (oponent) ; Harár, Pavol (vedoucí práce)
Práce se zabývá možností použití hluboké rekurentní neuronové sítě typu Long Short-Term Memory pro robustní odšumování zarušeného signálu. LSTM je v současnosti velice lákavá architektura díky své vlastnosti pamatovat si předchozí váhy, a nebo je upravovat nejen dle použitých algoritmů, ale také zkoumáním změn v sousedních buňkách. V práci je popsán výběr výchozího datasetu a použitých šumů spolu s vytvořením optimálních testovacích dat. Pro trénování sítě je zvolen framework KERAS pro jazyk Python a jsou prozkoumány a popsány kandidátní sítě pro možné řešení.

Chcete být upozorněni, pokud se objeví nové záznamy odpovídající tomuto dotazu?
Přihlásit se k odběru RSS.