Original title:
Vícekanálové metody zvýrazňování řeči
Translated title:
Multi-channel Methods of Speech Enhancement
Authors:
Zitka, Adam ; Balík, Miroslav (referee) ; Smékal, Zdeněk (advisor) Document type: Master’s theses
Year:
2008
Language:
cze Publisher:
Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií Abstract:
[cze][eng]
Diplomová práce se zabývá vícekanálovými metodami zvýrazňování řeči. Vícekanálové metody zvýrazňování řeči používají pro snímání signálů více mikrofonů. Ze směsí signálů můžeme pomocí neuronových sítí oddělit například jednotlivé mluvčí, potlačit hluk v pozadí či šum. Tato úloha bývá nazývána cocktail-party efekt. Hlavní metoda řešící tento problém se nazývá analýza nezávislých komponent. V práci jsou nejdříve popsány její teoretické základy a jsou představeny podmínky a požadavky k její aplikaci. Jednotlivé metody ICA se snaží směsi rozdělovat pomocí hledání co nejmenších gaussovských vlastností signálů. Pro analýzu nezávislých komponent se používají různé matematické vlastnosti signálů jako je např. špičatost a entropie. Signály, které byly smíšeny uměle v počítači, lze poměrně dobře oddělovat např. pomocí FastICA či algoritmu rostoucího gradientu. Složitější situace nastává, chceme-li oddělit signály pořízené v reálném nahrávacím prostředí, protože separaci řeči osob současně mluvících v reálném prostředí ovlivňují různé další okolnosti jako akustické vlastnosti místnosti, šum, zpoždění, odrazy od stěn, pozice či typ mikrofonů apod. Práce představuje postup analýzy nezávislých komponent ve frekvenční oblasti, který dokáže úspěšně oddělit i nahrávky pořízené v reálném prostředí.
This thesis deals with multi-channel methods of speech enhancement. Multichannel methods of speech enhancement use a few microphones for recording signals. From mixtures of signals, for example, individual speakers can be separated, noise should be reduced etc. with using neural networks. The task of separating speakers is known as a cocktail-party effect. The main method of solving this problem is called independent component analysis. At first there are described its theoretical foundation and presented conditions and requirements for its application. Methods of ICA try to separate the mixtures with help of searching the minimal gaussian properties of signals. For the analysis of independent components are used different mathematical properties of signals such as kurtosis and entropy. Signals, which were mixed artificially on a computer, can be relatively well separated using, for example, FastICA algorithm or ICA gradient ascent. However, difficult is situation, if we want to separate the signals created in the real recording enviroment, because the separation of speech people speaking at the same time in the real environment affects other various factors such as acoustic properties of the room, noise, delays, reflections from the walls, the position or the type of microphones, etc. Work presents aproach of independent component analysis in the frequency domain, which can successfully separate also recordings made in the real environment.
Keywords:
blind source separation; cocktail-party effect; ICA; independent component analysis; speech enhancement; analýza nezávislých komponent; cocktail-party efekt; ICA; slepá separace zdrojů; zvýrazňování řeči
Institution: Brno University of Technology
(web)
Document availability information: Fulltext is available in the Brno University of Technology Digital Library. Original record: http://hdl.handle.net/11012/18881