Národní úložiště šedé literatury Nalezeno 86 záznamů.  1 - 10dalšíkonec  přejít na záznam: Hledání trvalo 0.01 vteřin. 
Extensions to Probabilistic Linear Discriminant Analysis for Speaker Recognition
Plchot, Oldřich ; Fousek, Petr (oponent) ; McCree,, Alan (oponent) ; Burget, Lukáš (vedoucí práce)
This thesis deals with probabilistic models for automatic speaker verification. In particular, the Probabilistic Linear Discriminant Analysis (PLDA) model, which models i--vector representation of speech utterances, is analyzed in detail. The thesis proposes extensions to the standard state-of-the-art PLDA model. The newly proposed Full Posterior Distribution PLDA  models the uncertainty associated with the i--vector generation process. A new discriminative approach to training the speaker verification system based on the~PLDA model is also proposed. When comparing the original PLDA with the model extended by considering the i--vector uncertainty, results obtained with the extended model show up to 20% relative improvement on tests with short segments of speech. As the test segments get longer (more than one minute), the performance gain of the extended model is lower, but it is never worse than the baseline. Training data are, however, usually  available in the form of segments which are sufficiently long and therefore, in such cases, there is no gain from using the extended model  for training. Instead, the training can be performed with the original PLDA model and the extended model can be used if the task is to test on the short segments. The discriminative classifier is based on classifying pairs of i--vectors into two classes representing target and non-target trials. The functional form for obtaining the score for every i--vector pair is derived from the  PLDA model and training is based on the logistic regression minimizing  the cross-entropy error function  between the correct labeling of all trials and the probabilistic labeling proposed by the system. The results obtained with discriminatively trained system are similar to those obtained with generative baseline, but the discriminative approach shows the ability to output better calibrated scores. This property leads to a  better actual verification performance on an unseen evaluation set, which is an important feature for real use scenarios.
Monitoring hybridní síťové infrastruktury
Janda, Martin ; Plchot, Oldřich (oponent) ; Smrž, Pavel (vedoucí práce)
Tato bakalářská práce se věnuje vývoji univerzálního monitorovacího systému zařízení v hybridní síti pro společnost SELF servis. Systém slouží k ověření dostupnosti pomocí ICMP-paketů a ke sledování hodnot s využitím SNMP protokolu. V textu naleznete popis analýzy požadavků, návrhu systému a samotné implementace. V závěrečné kapitole se věnuji výsledkům z reálného provozu a nápadům pro další vývoj.
Algoritmické obchodování na burze s využitím dat z Twitteru
Kříž, Jakub ; Plchot, Oldřich (oponent) ; Szőke, Igor (vedoucí práce)
Práce se zabývá tvorbou systému, který na základě analýzy historických burzovních dat a zpráv z Twitteru predikuje budoucí vývoj trhu. Tweety ze dvou různých sad jsou analyzovány pomocí náladových slovníků nebo přes rekurentní neuronovou síť.  Z výsledků této analýzy a technické analýzy burzovních dat je pomocí vrstvené neuronové sítě prováděna predikce. Dle predikce poté systém vytvoří a otestuje obchodní strategii. V rámci práce je navržen a implementován celý systém, který pomocí dat z analýzy tweetů dosáhl zvýšení výnosu některých obchodních strategií o více než 25 %. Toto zlepšení však platí jen pro konkrétní data a časové období.
Rozpoznávání ručně psaných číslic metodou K-nearest neighbor
Horký, Vladimír ; Mikolov, Tomáš (oponent) ; Plchot, Oldřich (vedoucí práce)
Tato práce se zabývá problematikou rozpoznávání ručně psaných číslic. Rozebírá problémy při řešení rozpoznávání metodou K-nejbližších sousedů. Část práce popisuje postup při návrhu a implementaci této metody.
Unsupervised Evaluation of Speaker Recognition System
Odehnal, Ondřej ; Plchot, Oldřich (oponent) ; Matějka, Pavel (vedoucí práce)
The context of this thesis is the state-of-the-art system for speaker identification (SID) based on the deep nerual network with x-vector embeddings. This thesis aims to propose and experimentally assess several techniques for evaluating the SID system using unlabelled datasets. For this purpose, discriminative embedding is created for every recording in the dataset. These embeddings are used to cluster the recordings and thus create pseudo-labels corresponding to different clusters. The SID system evaluation is based on equal error rate (EER), which uses these pseudo-labels. We proposed several unsupervised learning algorithms to achieve this; K-means, Gaussian mixture models (GMM), and agglomerative hierarchical clustering (AHC). After thorough testing, the K-means model with the Silhouette value showed the best results. This method achieved an estimate of 5.72 % EER with the reference EER equal to 5.15 % on SITW dev-core-core. Similar results were observed on the SITW eval-core-core, where the estimated EER is equal to 5.86 % and the reference 5.08 %. The difference between estimated and reference EER is 0.57 % for the dev-core-core and 0.78 % for the eval-core-core. Another series of experiments were conducted on NIST SRE16 and VoxCeleb1 to verify robustness of the proposed method. Generally, the developed testing process had an estimated error of around 1 % in all test databases, an excellent result for an unsupervised learning technique.
Odhad obličeje z řečového signálu
Krušina, Josef ; Matějka, Pavel (oponent) ; Plchot, Oldřich (vedoucí práce)
Tato práce řeší problém mapování fixních reprezentací (embeddingů) řečového signálu na embeddingy obličejů a následné generování obličeje z namapovaného embeddingu pomocí generativní adverzní sítě (GAN) naučené na generování obličejů. GAN jsou druhem neuronových sítí, které umí generovat data podobná těm, na kterých se trénovala. Architektura navrženého systému je založena na čtyřech komponentách: na extraktoru embeddingů obličeje, na extraktoru embeddingů hlasu, na algoritmu nad GAN, který umí generovat obličej z embeddingu obličeje a na mnou implementované mapovací síti určené k mapování embeddingu hlasu na embedding obličeje. Jako extraktory embeddingů jsou převzaty předtrénované neuronové sítě FaceNet a SpeechBrain. Pro zpětné generování obličeje je převzatý model používající předtrénovaný StyleGAN2. Přínos této práce je ten, že dovoluje extrapolovat obličej pouze z audio signálu.
Webová demonstrace Fourierovy transformace pro výuku zpracování signálů
Hyrš, Martin ; Plchot, Oldřich (oponent) ; Černocký, Jan (vedoucí práce)
Cílem této práce je vytvořit vytvořit demonstrační program na téma Fourierova transformace. V úvodní části je shrnuta teorie týkající se jednotlivých typů Fourierovy transformace a je ukázán postup jejich numerické aproximace. V další kapitole jsou popsány již existující applety. Následně je navržena vlastní demonstrace, je popsána její implementace. Jsou uvedeny příklady použití výsledné aplikace a shrnuty reakce jejích uživatelů.
Penetration Tests of Speaker Verification System
Wojnar, Filip ; Landini, Federico Nicolás (oponent) ; Plchot, Oldřich (vedoucí práce)
The aim of the thesis is to realize penetration tests of automatic speaker verification system with use of text-to-speech model. The thesis is focused on inner functioning of those systems and spoofing attacks against them. The thesis is also focused on speech synthesis. Later chapters are focused on realization of realized penetration tests and discussion about results they brought us.
Problematika bezdrátových sítí
Jäger, Vítězslav ; Plchot, Oldřich (oponent) ; Koch, Miloš (vedoucí práce)
Obsahem mé práce je uvést základní problematiku bezdrátových sítí. Podává přehled o používaných standardech. Analyzuje nejrozšířenější z nich a zaměřuje se na jejich architekturu a bezpečnost. Dalším krokem bude vytvoření bezdrátové sítě pro potřeby střední školy.
Speaker Recognition in the VoIP Environment
Remeš, Jan ; Pešán, Jan (oponent) ; Plchot, Oldřich (vedoucí práce)
This work describes using speaker recognition systems in the VoIP environment, system performance and approaches to improving it. System architecture, evaluation metrics and VoIP technology key components from the view of speaker recognition are described. VoIP environment simulation is described. Speaker recognition system's performance is evaluated on data sets from various kinds of VoIP environments and the results are demonstrated. System adaptation and calibration is performed and their benefits are discussed.

Národní úložiště šedé literatury : Nalezeno 86 záznamů.   1 - 10dalšíkonec  přejít na záznam:
Chcete být upozorněni, pokud se objeví nové záznamy odpovídající tomuto dotazu?
Přihlásit se k odběru RSS.