Národní úložiště šedé literatury Nalezeno 5 záznamů.  Hledání trvalo 0.01 vteřin. 
Akustická detekce pozice řečníka pomocí mikrofonního pole
Chu, Yen Nhi ; Žmolíková, Kateřina (oponent) ; Szőke, Igor (vedoucí práce)
Cílem této práce je vytvořit systém umožňující detekci pozice řečníka v uzavřené místnosti opatřené mikrofonním polem. Přičemž se zabývá dvěma algoritmy pro lokalizaci zdroje zvuku, jmenovitě metodou tvarování přijímací charakteristiky a metodou časových zpoždění. Dané metody byly implementovány na poskytnutý hardware, spolehlivost metod otestována a výsledky byly vyhodnoceny. Výsledky ukázaly, že obě použité metody jsou poměrně přesné, pokud jsou použity v malém prostoru (přibližně 3×3 m). Nedostatky použitého řešení jsou podrobně rozebrány a jsou navržena možná vylepšení. Dané řešení je použitelné jako základ pro tvorbu vestavěných systémů, které budou moci určit polohu zdroje zvuku
Mikrofonová pole pro prostorovou separaci akustických signálů
Grobelný, Petr ; Schimmel, Jiří (oponent) ; Míča, Ivan (vedoucí práce)
Cílem této práce bylo prozkoumání metody lokalizace zdrojů akustického signálu a jejich následná separace pomocí algoritmů tvarování přijímací charakteristiky mikrofonového pole. Posléze byly vybrány dvě geometrie mikrofonních polí, lineární a kruhová,na kterých byly experimentálně ověřeny lokalizační a separační schopnosti metod tvarování přijímací charakteristiky, jmenovitě metody Delay and Sum a Constant Directivy Beamforming - Circular Arrays, v reálném prostředí.
Analýza kombinace informací ve více-kanálové verifikaci mluvčích
Procházka, Jan ; Plchot, Oldřich (oponent) ; Mošner, Ladislav (vedoucí práce)
Tato práce se zabývá analýzou a porovnáním kombinací informací více-kanálových řečových dat pro úlohu verifikace mluvčího. Byly zvoleny tři úrovně/reprezentace pro fúzi dat: kombinace na úrovni signálu, embeddingu a skóre. Na úrovni signálu jsou implementovány prostorové filtry (algoritmy formování svazku – beamforming). Řečové nahrávky slouží jako vstup do neuronové sítě (architektura ECAPA-TDNN), která extrahuje „embeddingy“, vektorovou reprezentaci mluvčího. Vektory jsou dále porovnány pomocí kosinové podobnosti, jehož výsledkem jsou skóre, reálná čísla. Nejlepšího relativního zlepšení proti jedno-kanálovým nahrávkám dosahuje fúze na úrovni skóre (až 70 %), nejkonzistentnější výsledky pro různé podmínky pořizování nahrávek poskytuje fúze na úrovni embeddingu.
Akustická detekce pozice řečníka pomocí mikrofonního pole
Chu, Yen Nhi ; Žmolíková, Kateřina (oponent) ; Szőke, Igor (vedoucí práce)
Cílem této práce je vytvořit systém umožňující detekci pozice řečníka v uzavřené místnosti opatřené mikrofonním polem. Přičemž se zabývá dvěma algoritmy pro lokalizaci zdroje zvuku, jmenovitě metodou tvarování přijímací charakteristiky a metodou časových zpoždění. Dané metody byly implementovány na poskytnutý hardware, spolehlivost metod otestována a výsledky byly vyhodnoceny. Výsledky ukázaly, že obě použité metody jsou poměrně přesné, pokud jsou použity v malém prostoru (přibližně 3×3 m). Nedostatky použitého řešení jsou podrobně rozebrány a jsou navržena možná vylepšení. Dané řešení je použitelné jako základ pro tvorbu vestavěných systémů, které budou moci určit polohu zdroje zvuku
Mikrofonová pole pro prostorovou separaci akustických signálů
Grobelný, Petr ; Schimmel, Jiří (oponent) ; Míča, Ivan (vedoucí práce)
Cílem této práce bylo prozkoumání metody lokalizace zdrojů akustického signálu a jejich následná separace pomocí algoritmů tvarování přijímací charakteristiky mikrofonového pole. Posléze byly vybrány dvě geometrie mikrofonních polí, lineární a kruhová,na kterých byly experimentálně ověřeny lokalizační a separační schopnosti metod tvarování přijímací charakteristiky, jmenovitě metody Delay and Sum a Constant Directivy Beamforming - Circular Arrays, v reálném prostředí.

Chcete být upozorněni, pokud se objeví nové záznamy odpovídající tomuto dotazu?
Přihlásit se k odběru RSS.