keywords:"SpeechBrain" - Výsledky hledání - Digitální repozitář

host :: přihlásit Digitální repozitář
		Hledej		Nový záznam		Nápověda		O repozitáři

Hlavní stránka > Výsledky hledání: keywords:"SpeechBrain"

Hledej:

Tipy pro vyhledávaní :: Rozšířené hledání

Hledej ve sbírkách:

Seřadit podle:	Zobrazit výsledky:	Výstupní formát:

	Robustní odšumování a dereverberace audia Košina, Simon ; Skácel, Miroslav (oponent) ; Szőke, Igor (vedoucí práce) Cieľom tejto práce je vytvorenie modelu pre odšumovanie a dereverberáciu audio nahrávok pochádzajúcich z leteckej VHF komunikácie. Práca popisuje teoretické základy strojového učenia a rôzne architektúry neurónových sieti, ktoré sa v prípade podobných problémov často používajú. Nasleduje popis použitých nástrojov, implementácie a dátových sád. Posledné kapitoly sa venujú vykonaným experimentom, dosiahnutým výsledkom a nadväzujúcej práci. Úplný záznam
	Odhad obličeje z řečového signálu Krušina, Josef ; Matějka, Pavel (oponent) ; Plchot, Oldřich (vedoucí práce) Tato práce řeší problém mapování fixních reprezentací (embeddingů) řečového signálu na embeddingy obličejů a následné generování obličeje z namapovaného embeddingu pomocí generativní adverzní sítě (GAN) naučené na generování obličejů. GAN jsou druhem neuronových sítí, které umí generovat data podobná těm, na kterých se trénovala. Architektura navrženého systému je založena na čtyřech komponentách: na extraktoru embeddingů obličeje, na extraktoru embeddingů hlasu, na algoritmu nad GAN, který umí generovat obličej z embeddingu obličeje a na mnou implementované mapovací síti určené k mapování embeddingu hlasu na embedding obličeje. Jako extraktory embeddingů jsou převzaty předtrénované neuronové sítě FaceNet a SpeechBrain. Pro zpětné generování obličeje je převzatý model používající předtrénovaný StyleGAN2. Přínos této práce je ten, že dovoluje extrapolovat obličej pouze z audio signálu. Úplný záznam
	Odhad obličeje z řečového signálu Krušina, Josef ; Matějka, Pavel (oponent) ; Plchot, Oldřich (vedoucí práce) Tato práce řeší problém mapování fixních reprezentací (embeddingů) řečového signálu na embeddingy obličejů a následné generování obličeje z namapovaného embeddingu pomocí generativní adverzní sítě (GAN) naučené na generování obličejů. GAN jsou druhem neuronových sítí, které umí generovat data podobná těm, na kterých se trénovala. Architektura navrženého systému je založena na čtyřech komponentách: na extraktoru embeddingů obličeje, na extraktoru embeddingů hlasu, na algoritmu nad GAN, který umí generovat obličej z embeddingu obličeje a na mnou implementované mapovací síti určené k mapování embeddingu hlasu na embedding obličeje. Jako extraktory embeddingů jsou převzaty předtrénované neuronové sítě FaceNet a SpeechBrain. Pro zpětné generování obličeje je převzatý model používající předtrénovaný StyleGAN2. Přínos této práce je ten, že dovoluje extrapolovat obličej pouze z audio signálu. Úplný záznam
	Robustní odšumování a dereverberace audia Košina, Simon ; Skácel, Miroslav (oponent) ; Szőke, Igor (vedoucí práce) Cieľom tejto práce je vytvorenie modelu pre odšumovanie a dereverberáciu audio nahrávok pochádzajúcich z leteckej VHF komunikácie. Práca popisuje teoretické základy strojového učenia a rôzne architektúry neurónových sieti, ktoré sa v prípade podobných problémov často používajú. Nasleduje popis použitých nástrojov, implementácie a dátových sád. Posledné kapitoly sa venujú vykonaným experimentom, dosiahnutým výsledkom a nadväzujúcej práci. Úplný záznam

Chcete být upozorněni, pokud se objeví nové záznamy odpovídající tomuto dotazu?
Přihlásit se k odběru RSS.

Digitální repozitář :: :: :: ::
Powered by v1.1.2
Spravuje

Tato stránka je dostupná také v následujících jazycích:
Česky English