Národní úložiště šedé literatury Nalezeno 4 záznamů.  Hledání trvalo 0.01 vteřin. 
Robustní odšumování a dereverberace audia
Košina, Simon ; Skácel, Miroslav (oponent) ; Szőke, Igor (vedoucí práce)
Cieľom tejto práce je vytvorenie modelu pre odšumovanie a dereverberáciu audio nahrávok pochádzajúcich z leteckej VHF komunikácie. Práca popisuje teoretické základy strojového učenia a rôzne architektúry neurónových sieti, ktoré sa v prípade podobných problémov často používajú. Nasleduje popis použitých nástrojov, implementácie a dátových sád. Posledné kapitoly sa venujú vykonaným experimentom, dosiahnutým výsledkom a nadväzujúcej práci.
Odhad obličeje z řečového signálu
Krušina, Josef ; Matějka, Pavel (oponent) ; Plchot, Oldřich (vedoucí práce)
Tato práce řeší problém mapování fixních reprezentací (embeddingů) řečového signálu na embeddingy obličejů a následné generování obličeje z namapovaného embeddingu pomocí generativní adverzní sítě (GAN) naučené na generování obličejů. GAN jsou druhem neuronových sítí, které umí generovat data podobná těm, na kterých se trénovala. Architektura navrženého systému je založena na čtyřech komponentách: na extraktoru embeddingů obličeje, na extraktoru embeddingů hlasu, na algoritmu nad GAN, který umí generovat obličej z embeddingu obličeje a na mnou implementované mapovací síti určené k mapování embeddingu hlasu na embedding obličeje. Jako extraktory embeddingů jsou převzaty předtrénované neuronové sítě FaceNet a SpeechBrain. Pro zpětné generování obličeje je převzatý model používající předtrénovaný StyleGAN2. Přínos této práce je ten, že dovoluje extrapolovat obličej pouze z audio signálu.
Odhad obličeje z řečového signálu
Krušina, Josef ; Matějka, Pavel (oponent) ; Plchot, Oldřich (vedoucí práce)
Tato práce řeší problém mapování fixních reprezentací (embeddingů) řečového signálu na embeddingy obličejů a následné generování obličeje z namapovaného embeddingu pomocí generativní adverzní sítě (GAN) naučené na generování obličejů. GAN jsou druhem neuronových sítí, které umí generovat data podobná těm, na kterých se trénovala. Architektura navrženého systému je založena na čtyřech komponentách: na extraktoru embeddingů obličeje, na extraktoru embeddingů hlasu, na algoritmu nad GAN, který umí generovat obličej z embeddingu obličeje a na mnou implementované mapovací síti určené k mapování embeddingu hlasu na embedding obličeje. Jako extraktory embeddingů jsou převzaty předtrénované neuronové sítě FaceNet a SpeechBrain. Pro zpětné generování obličeje je převzatý model používající předtrénovaný StyleGAN2. Přínos této práce je ten, že dovoluje extrapolovat obličej pouze z audio signálu.
Robustní odšumování a dereverberace audia
Košina, Simon ; Skácel, Miroslav (oponent) ; Szőke, Igor (vedoucí práce)
Cieľom tejto práce je vytvorenie modelu pre odšumovanie a dereverberáciu audio nahrávok pochádzajúcich z leteckej VHF komunikácie. Práca popisuje teoretické základy strojového učenia a rôzne architektúry neurónových sieti, ktoré sa v prípade podobných problémov často používajú. Nasleduje popis použitých nástrojov, implementácie a dátových sád. Posledné kapitoly sa venujú vykonaným experimentom, dosiahnutým výsledkom a nadväzujúcej práci.

Chcete být upozorněni, pokud se objeví nové záznamy odpovídající tomuto dotazu?
Přihlásit se k odběru RSS.