Národní úložiště šedé literatury Nalezeno 39 záznamů.  předchozí8 - 17dalšíkonec  přejít na záznam: Hledání trvalo 0.01 vteřin. 
Rozpoznávání mluvčího
Kašpar, Ladislav ; Atassi, Hicham (oponent) ; Sysel, Petr (vedoucí práce)
Ve své bakalářské práci se věnuji problému rozpoznávání mluvčího. Tato práce obsahuje základní teorie k tomuto tématu. Teorie je zaměřena na výpočet parametrů pro rozpoznávání mluvčího a na popis postupu při rozpoznávání mluvčího. Jako hlavní parametry v programu na rozpoznávání mluvčího napsaného v jazyce Matlab využívám kmitočty formantů, kepstrální koeficienty a segmentaci signálu.
Personal Voice Activity Detection
Sedláček, Šimon ; Landini, Federico Nicolás (oponent) ; Švec, Ján (vedoucí práce)
This work aims to implement, test, and evaluate a speaker-conditioned Voice Activity Detection (VAD) method called Personal VAD. The method builds upon an LSTM-based approach to VAD and its purpose is to introduce a system that can reliably detect speech of a target speaker, while retaining the typical characteristics of a VAD system, mainly in terms of small model size, low latency, and low necessary computational resources. The system is trained to distinguish between three classes: non-speech, target speaker speech, and non-target speaker speech. For this purpose, the method utilizes speaker embeddings as a part of the input feature vector to represent the target speaker. Some of the more heavyweight personal VAD variants also make use of speaker verification scores issued to each frame based on the target embedding, resulting in a more robust system. In addition to the one scoring method presented in the original article, two other scoring approaches are introduced, both outperforming the baseline method and improving the performance even for acoustically challenging conditions.
Speaker Recognition in the VoIP Environment
Remeš, Jan ; Pešán, Jan (oponent) ; Plchot, Oldřich (vedoucí práce)
This work describes using speaker recognition systems in the VoIP environment, system performance and approaches to improving it. System architecture, evaluation metrics and VoIP technology key components from the view of speaker recognition are described. VoIP environment simulation is described. Speaker recognition system's performance is evaluated on data sets from various kinds of VoIP environments and the results are demonstrated. System adaptation and calibration is performed and their benefits are discussed.
Speaker Recognition Based on Long Temporal Context
Fér, Radek ; Matějka, Pavel (oponent) ; Černocký, Jan (vedoucí práce)
This work deals with temporal features for automated speaker recognition. We give overview of currently known temporal feature extraction methods and afterwards, we propose and preliminarily evaluate a general phoneme-level temporal feature extraction scheme based on factor analysis i-vector paradigm. Much effort has been made to reasonably represent temporal context and make speaker recognition systems more robust, namely speech prosody modeling. Our approach does not explicitly model any temporal parameters of speech, rather it uses the occurrence of neighboring frames as a source of temporal information. We test and analyze this method on standard evaluation database NIST SRE 2008. The results indicate, however, that for speaker recognition, no useful gain can be obtained using this technique. We describe and discuss this discovery at the end.
Ukázkový systém na rozpoznávání mluvčích
Šústek, Martin ; Šebesta, Vladimír (oponent) ; Sigmund, Milan (vedoucí práce)
Ve své diplomové práci se věnuje problému rozpoznávání mluvčích. V textu je popsána základní teorie k tomuto tématu, návrh a realizace systému pro rozpoznávání tří mluvčích. V teorii se zabývám výpočtem parametrů pro rozpoznávání mluvčích. Program pro rozpoznávání je vytvořen v Matlabu jako samostatná aplikace. Program je napsán dvojjazyčně česky a anglicky. Pro správnou funkci systému potřebujeme mít mikrofon a zvukovou kartu v počítači s operačním systém Windows.
Neuronové sítě při klasifikaci mluvčích
Svoboda, Libor ; Atassi, Hicham (oponent) ; Míča, Ivan (vedoucí práce)
Obsah této práce je zaměřen na neuronové sítě při klasifikaci mluvčích. Pojednává o problematice zpracování řečového signálu a jsou zde uvedeny i některé typy neuronových sítí. Součástí práce bylo sestavení databáze nahrávek od řečníků různého pohlaví a věku. Z této databáze pak byla sestavena trénovací a testovací skupina. Dále byly navrženy čtyři klasifikátory. Jeden na bázi směsi Gaussových hustotních funkcí a tři neuronové klasifikátory. Tyto systémy byly testovány a analyzovány podle věku, pohlaví a na závěr pro obě tyto kritéria. Současně je věnována pozornost i volbě vhodných příznaků v každé této úloze klasifikace. Na konci práce jsou uvedeny výsledky analýz pro jednotlivé skupiny i příznaky. Z těchto výsledků jsou stanoveny nejvhodnější příznaky, pro danou úlohu klasifikace a také nejúspěšnější klasifikátory.
Identifikace osob pomocí otisku hlasu
Mekyska, Jiří ; Atassi, Hicham (oponent) ; Smékal, Zdeněk (vedoucí práce)
Tato práce se zabývá textově závislým rozpoznáváním řečníků v systémech, kde existuje pouze omezené množství trénovacích vzorků. Pro účel rozpoznávání je navržen otisk hlasu založený na různých příznacích (např. MFCC, PLP, ACW atd.). Na začátku práce je zmíněn způsob vytváření řečového signálu. Některé charakteristiky řeči, důležité pro rozpoznávání řečníků, jsou rovněž zmíněny. Další část práce se zabývá analýzou řečového signálu. Je zde zmíněno předzpracování a také metody extrakce příznaků. Následující část popisuje proces rozpoznávání řečníků a zmiňuje způsoby ohodnocení používaných metod: identifikace a verifikace řečníků. Poslední teoreticky založená část práce se zabývá klasifikátory vhodnými pro textově závislé rozpoznávání. Jsou zmíněny klasifikátory založené na zlomkových vzdálenostech, dynamickém borcení časové osy, vyrovnávání rozptylu a vektorové kvantizaci. Tato práce pokračuje návrhem a realizací systému, který hodnotí všechny zmíněné klasifikátory pro otisk hlasu založený na různých příznacích.
Textově závislé rozpoznávání mluvčího
Fux, Jan ; Glembek, Ondřej (oponent) ; Matějka, Pavel (vedoucí práce)
Cílem této bakalářské práce bylo navrhnout systém pro textově závislé rozpoznávání mluvčího. Bylo otestováno několik přístupů na databázi MIT, která obsahuje nahrávky průměrné délky 0,46s. Z otestovaných přístupů se jeví jako nejlepší kombinace systému DTW s využitím odhadu posteriorních pravděpodobností fonémů (posteriogramu) jako výstupu z Fonémového rozpoznávače, a akustického SID systému založeného na iVektorech a PLDA (Probabilistic Linear Component Analysis). Fúze těchto dvou systémů pomocí Neuronové sítě dosahuje nejlepších výsledků (EER) a to 17,84% pro ženy a 16,38% pro muže, což je relativní zlepšení 49,9% u žen a 54,2% u mužů oproti samostatnému akustickému rozpoznávání.
Adaptace systémů pro rozpoznání mluvčího
Novotný, Ondřej ; Pešán, Jan (oponent) ; Plchot, Oldřich (vedoucí práce)
V této práci navrhneme techniky adaptace systémů na rozpoznávání řeči. Cílem je vytvořit techniku adaptace Pravděpodobnostní lineární diskriminační analýzy. Zaměříme se na adap-taci bez učitele. Naše testy ukáží vhodné shlukovací techniky pro odhad identity mluvčích a vhodné techniky na odhad počtu mluvčích v adaptační datové sadě. Experimenty jsou prováděny na korpusech NIST a Switchboard.
Grafické a video příznaky v rozpoznávání mluvčího
Fér, Radek ; Matějka, Pavel (oponent) ; Černocký, Jan (vedoucí práce)
Tato práce popisuje netradiční metodu rozpoznávání řečníka pomocí příznaků a alogoritmů používaných převážně v počítačovém vidění. V úvodu jsou shrnuty potřebné teoretické znalosti z oblasti počítačového rozpoznávání. Jako aplikace grafických příznaků v rozpoznávání řečníka jsou detailněji popsány již známé BBF příznaky. Tyto jsou vyhodnoceny nad standardními řečovými databázemi TIMIT a NIST SRE 2010. Experimentální výsledky jsou shrnuty a porovnány se standardními metodami. V závěru jsou jsou navrženy možné směry budoucí práce.

Národní úložiště šedé literatury : Nalezeno 39 záznamů.   předchozí8 - 17dalšíkonec  přejít na záznam:
Chcete být upozorněni, pokud se objeví nové záznamy odpovídající tomuto dotazu?
Přihlásit se k odběru RSS.