Original title:
Akustická detekce pozice řečníka pomocí mikrofonního pole
Translated title:
Acoustic Detection of Speaker Position Using Microphone Array
Authors:
Horázný, František ; Mošner, Ladislav (referee) ; Szőke, Igor (advisor) Document type: Bachelor's theses
Year:
2020
Language:
cze Publisher:
Vysoké učení technické v Brně. Fakulta informačních technologií Abstract:
[cze][eng]
Tato práce se zabývá problematikou určení přibližné polohy zdroje zvuku v souřadném systému pomocí mikrofonního pole. Zabývá se všemi vlivy na určení polohy pomocí audio signálů. Vysvětluje základní principy metod, které jsou využity pro detekci zdroje zvuku. Je zde uveden návrh řešení pro synchronizované statické nahrávky a dále úprava pro běh v reálném čase na sestavě systému ARM/SHARC, která má omezený výkon. Součástí řešení je také testování jednotlivých komponent a jejich parametrů. Znázorňuje vliv změn těchto parametrů na chování systému. Současně jsou popsány experimenty s výslednou aplikací ukazující změnu výsledků při výpočtu bez výkonnostního omezení a při běhu na zvukové kartě. Na závěr jsou uvedena doporučení a předpoklady jak docílit lepších výsledků při využívání programu a jak eliminovat omezení systému za nepříznivých podmínek.
This thesis describes the problem of determining the approximate position of a sound source in a coordinate system needed using the microphone field. It covers all possible variables influencing the detection of the sound source and explains the basic methods which can be used to determine the origin of the sound. The solution proposed in this thesis is to use synchronized static recordings and further modifications for running the program in real-time on the provided ARM/SHARC system, which has limited performance. This thesis contains also tests of the individual components and their parameters. The effect of changing these parameters on the behavior of the system is also shown in this thesis. Additionally, the developed application is used to perform the experiments demonstrating the shift of results during computation without any limitations and when running on the sound system. It also shows experiments with the resulting application, how the results change when calculating without performance limitation and when running on a sound card. Finally, this thesis gives several recommendations and assumptions on how to improve the results when using the program and how to eliminate several system limitations in unfavorable conditions.
Keywords:
correlation; detection of speech; hyperbola; Microphone array; normalised cross correlation; positioning; sound source; TDOA.; detekce řeči; hyperbola; korelace; Mikrofonní pole; normalizovaná křížová korelace; TDOA.; určení polohy; zdroj zvuku
Institution: Brno University of Technology
(web)
Document availability information: Fulltext is available in the Brno University of Technology Digital Library. Original record: http://hdl.handle.net/11012/191501