National Repository of Grey Literature 86 records found  1 - 10nextend  jump to record: Search took 0.01 seconds. 
Extensions to Probabilistic Linear Discriminant Analysis for Speaker Recognition
Plchot, Oldřich ; Fousek, Petr (referee) ; McCree,, Alan (referee) ; Burget, Lukáš (advisor)
Tato práce se zabývá pravděpodobnostními modely pro automatické rozpoznávání řečníka. Podrobně analyzuje zejména pravděpodobnostní lineární diskriminační analýzu (PLDA), která modeluje nízkodimenzionální reprezentace promluv ve formě \acronym{i--vektorů}.  Práce navrhuje dvě rozšíření v současnosti požívaného PLDA modelu. Nově navržený PLDA model s plným posteriorním rozložením  modeluje neurčitost při generování i--vektorů. Práce také navrhuje nový diskriminativní přístup k trénování systému pro verifikaci řečníka, který je založený na PLDA. Pokud srovnáváme původní PLDA s modelem rozšířeným o modelování  neurčitosti i--vektorů, výsledky dosažené s rozšířeným modelem dosahují až 20% relativního zlepšení při testech s krátkými nahrávkami. Pro delší  testovací segmenty  (více než jedna minuta) je zisk v přesnosti  menší, nicméně přesnost nového modelu není nikdy menší než přesnost výchozího systému.  Trénovací data jsou ale obvykle dostupná ve formě dostatečně dlouhých segmentů, proto v těchto případech použití nového modelu neposkytuje žádné výhody při trénování. Při trénování může být použit původní PLDA model a jeho rozšířená verze může být využita pro získání skóre v  případě, kdy se bude provádět testování na krátkých segmentech řeči. Diskriminativní model je založen na klasifikaci dvojic i--vektorů do dvou tříd představujících oprávněný a neoprávněný soud (target a non-target trial). Funkcionální forma pro získání skóre pro každý pár je odvozena z PLDA a trénování je založeno na logistické regresi, která minimalizuje vzájemnou entropii mezi správným označením všech soudů a pravděpodobnostním označením soudů, které navrhuje systém. Výsledky dosažené s diskriminativně trénovaným klasifikátorem jsou podobné výsledkům generativního PLDA, ale diskriminativní systém prokazuje schopnost produkovat lépe kalibrované skóre. Tato schopnost vede k lepší skutečné přesnosti na neviděné evaluační sadě, což je důležitá vlastnost pro reálné použití.
Monitoring Hybrid Net Infrastructure
Janda, Martin ; Plchot, Oldřich (referee) ; Smrž, Pavel (advisor)
This bachelor thesis follows developement of automatic monitoring system of devices in hybrid network for SELF servis company. System's purpose is to check availability by ICMP packets and to watch values by SNMP protocol. In this text you'll find description of requirements analysis, design of the system and implementation. In the last chapter follows results from real use and ideas for further development.
Algorithmic Trading Using Twitter Data
Kříž, Jakub ; Plchot, Oldřich (referee) ; Szőke, Igor (advisor)
This master's thesis describes creation of prediction system. This system predicts future market development based on stock exchange data and twitter messages analysis. Tweets from two different sources are analysed by mood dictionaries or via recurrent neural networks. This analysis results and technical analysis of stock exchange data results are used in multilayer neural network for prediction. A business strategy is created and tested based on results of this prediction. Design and implementation of prediction system is described in this thesis. This system achieved revenue increase more than 25 % of some business strategies by tweets analysis. However this improvement applies for certain data and timeframe.
Handwritten Digit Recognition Using K-nearest Neighbor
Horký, Vladimír ; Mikolov, Tomáš (referee) ; Plchot, Oldřich (advisor)
This paper describes problems of handwritten digit recognition. Discuss about problems with solution of recognition by algorithm K-nearests neighbor. In second part there is described design and implementation of this method.
Unsupervised Evaluation of Speaker Recognition System
Odehnal, Ondřej ; Plchot, Oldřich (referee) ; Matějka, Pavel (advisor)
Tato práce je vystavěna nad moderním systémem pro rozpoznávání mluvčího (SID) založeného na x-vektorech. Cílem bakalářské práce je navrhnout a experimentálně vyhodnotit techniky pro evaluaci SID systému za použití audio nahrávek bez anotace tj. bez znalosti mluvčího. Pro tento účel je z každé nahrávky bez anotace vytvořen embedding. Ty se poté používají pro shlukování nahrávek a následné vytvoření pseudo-anotací. Na těchto anotacích se SID systém evaluuje pomocí equal error rate (EER) metriky. Za účelem vytvoření pseudo-anotací byly navrženy tyto shlukovací algoritmy učení bez učitele: K-means, Gaussian mixture models (GMM) a aglomerativní shlukování. Po testování vyšel jakožto nejlepší experimentální postup K-means se Silhouette metrikou, která používá kosinovou podobnost jako míru vzdálenosti. Nejlepší metoda dosáhla 5,72 % EER s referenčním EER = 5,15 %, které bylo spočítané se znalostí anotace na části datasetu SITW dev-core-core. Podobné výsledky byly získány na části datasetu SITW eval-core-core s odhadnutým EER = 5,86 % a referenčním 5,08 %. Rozdíl mezi hodnotami tvoří 0,57 % pro eval-core-core a 0, 78% pro dev-core-core. Další testy na NIST SRE16 a VoxCeleb1 datasetech byly provedeny za účelem ověření správnosti navrženého postupu. Obecně se dá říct, že navržený testovací postup měl chybu přibližně 1 %, což je poměrně dobrý výsledek pro algoritmus učení bez učitele.
Learning the Face Behind a Voice
Krušina, Josef ; Matějka, Pavel (referee) ; Plchot, Oldřich (advisor)
This work addresses the problem of mapping fixed representations (embeddings) of a speech signal to face embeddings and then generating a face from the mapped embedding using a generative adversarial network (GAN) that was trained for face generation. GANs are a type of neural networks that can generate data similar to the data they were trained on. The architecture of the proposed system is based on four components: a face embedding extractor, a voice embedding extractor, an algorithm on top of a GAN that can generate a face from a face embedding, and my mapping network used to map a voice embedding to a face embedding. The pre-trained neural networks FaceNet and SpeechBrain are adopted as embedding extractors. A model that uses a pre-trained StyleGAN2 is adopted for backward face generation. The contribution of this work is that it allows the extrapolation of a face from audio signal only.
Web-Based Demo of Fourier Transform for Signal Processing Courses
Hyrš, Martin ; Plchot, Oldřich (referee) ; Černocký, Jan (advisor)
The aim of this work is to create a program demonstrating the Fourier transform. The introductory section summarizes the theory of Fourier transform and shows the procedure for its numerical approximation. The following chapter describes the existing applets. Subsequently, the concept of the demonstration and its implementation are described. The final part contains tutorial examples of using the application and summary of users' reactions.
Penetration Tests of Speaker Verification System
Wojnar, Filip ; Landini, Federico Nicolás (referee) ; Plchot, Oldřich (advisor)
Cílem práce je provést penetrační testy na systému pro automatickou verifikace řečníka za použití syntézy řeči. Práce se zabývá fungování systému pro automatickou verifikaci řečníka a spoofing útoky na systémy, zabývající se touto problematikou. Práce se také podrobnějí zabývá fungováním syntézy řeči. Pozdější kapitoly se zabývají realizací penetračních testů a výsledky, které nám tyto testy přinesly.
Wireless Fidelity Networks
Jäger, Vítězslav ; Plchot, Oldřich (referee) ; Koch, Miloš (advisor)
Purpose of my Bachelor‘s thesis is to inform about general problems of wireless networks. My work is giving overview about using standards. It Analyzes the most common of them and focuses on their architecture and safety. Part of my work will be a creation of the wireless network for needs of a high school.
Speaker Recognition in the VoIP Environment
Remeš, Jan ; Pešán, Jan (referee) ; Plchot, Oldřich (advisor)
Tato práce popisuje použití systémů pro rozpoznávání mluvčího v~prostředí VoIP, úspěšnost systému a přístupy k jejímu zlepšení. Popisuje architekturu těchto systémů, metriky pro vyhodnocení jejich úspěšnosti a klíčové komponenty VoIP z hlediska rozpoznávání mluvčího. Je zde popsáno vytvoření simulace VoIP prostředí, úspěšnost systému je vyhodnocena na datech pocházejících z různých druhů VoIP prostředí a výsledky jsou demostrovány. Adaptace a kalibrace systému je provedena a jejich přínosy zhodnoceny.

National Repository of Grey Literature : 86 records found   1 - 10nextend  jump to record:
Interested in being notified about new results for this query?
Subscribe to the RSS feed.