Národní úložiště šedé literatury Nalezeno 20 záznamů.  1 - 10další  přejít na záznam: Hledání trvalo 0.00 vteřin. 
Rozpoznávání mluvčího
Kašpar, Ladislav ; Atassi, Hicham (oponent) ; Sysel, Petr (vedoucí práce)
Ve své bakalářské práci se věnuji problému rozpoznávání mluvčího. Tato práce obsahuje základní teorie k tomuto tématu. Teorie je zaměřena na výpočet parametrů pro rozpoznávání mluvčího a na popis postupu při rozpoznávání mluvčího. Jako hlavní parametry v programu na rozpoznávání mluvčího napsaného v jazyce Matlab využívám kmitočty formantů, kepstrální koeficienty a segmentaci signálu.
Rozpoznávání mluvčího ve Skype hovorech
Kaňok, Tomáš ; Glembek, Ondřej (oponent) ; Schwarz, Petr (vedoucí práce)
Tato diplomová práce se zabývá problematikou strojové identifikace a verifikace řečníka, její teorií a aplikací. Vyhodnocuje existující implementaci dané problematiky skupinou Speech@FIT. Dále se zabývá problematikou tvorby zásuvných modulů do komunikačního programu Skype. Následně je navržen zásuvný modul pro Skype umožňující identifikaci a verifikaci řečníka. Ten je implementován a vyhodnocen. V závěru jsou uvedeny návrhy dalšího vývoje.
Intersession Variability Compensation in Language and Speaker Identification
Hubeika, Valiantsina ; Burget, Lukáš (oponent) ; Matějka, Pavel (vedoucí práce)
Varibiality in the channel and session is an important issue in the text-independent speaker recognition task. To date, several techniques providing channel and session variability compensation were introduced in a number of scientic papers. Such implementation can be done in feature, model and score domain. Relatively new and powerful approach to remove channel distortion is so-called eigenchannel adaptation for Gaussian Mixture Models (GMM). The drawback of the technique is that it is not applicable in its original implementation to different types of classifiers, eg. Support Vector Machines (SVM), GMM with different number of Gaussians or in speech recognition task using Hidden Markov Models (HMM). The solution can be the approximation of the technique, eigenchannel adaptation in feature domain. Both, the original eigenchannel adaptation and eigenchannel adaptation on features in task of speaker recognition are presented. After achieving good results in speaker recognition, contribution of the same techniques was examined in acoustic language identification system with $14$ languages. In this task undesired factors are channel and speaker variability. Presented results are presented on the NIST Speaker Recognition Evaluation 2006 data and NIST Language Recognition Evaluation 2007 data.
Speaker Recognition on Mobile Phone
Pešán, Jan ; Glembek, Ondřej (oponent) ; Černocký, Jan (vedoucí práce)
This work aims to port Speaker Identification System (SID) to the mobile device / mobile phone. We will describe basic principles, function and implementation of speaker identification system on Nokia N900 mobile phone.
Využití knihovny ALIZE pro identifikaci mluvčích
Skulínek, Zdeněk ; Burget, Radim (oponent) ; Přinosil, Jiří (vedoucí práce)
V posledních letech, kdy dochází k výraznému nárůstu výkonu počítačů, se na popředí dostaly mimo jiné i systémy pro rozeznávání mluvčího. Vznikla řada knihoven, ať již open--source či proprietárních, které se této problematice věnují. Jednou z takových knihoven je například ALIZE, která byla vyvinuta na univerzitě v Avignonu. Tato knihovna nabízí obecný koncept práce s biometrickými údaji, statistickými výpočty a kompletní framework pro zamýšlenou aplikaci. Úkolem této práce je tuto knihovnu vyzkoušet, a to postavením praktické aplikace pro rozeznávání mluvčího. Tato práce popisuje úspěšné sestavení této aplikace. Aplikace je platformně nezávislá a je také vyzkoušená na všech třech základních platformách. Ty jsou přílohou práce jako soubory do virtuálního stroje VirtualBox. Práce si všímá praktických zkušeností s knihovnou ALIZE, popisuje její strukturu a architekturu. Pro testování je použito celkem 50 vzorků od 9ti mluvčích, v délkách okolo 20ti sekund. Pro tyto délky funguje rozeznávání naprosto spolehlivě s dodanými vzorky. Proto je na závěr v tezi uskutečněn test skutečné délky potřebné k rozeznání mluvčího.
Multiplatformní aplikace pro verifikaci mluvčího
Görig, Jan ; Matějka, Pavel (oponent) ; Glembek, Ondřej (vedoucí práce)
Bakalářská práce se zabývá rozpoznáváním mluvčího bez znalosti textu sdělení. Zmiňuje dnes používané způsoby extrakce příznaků a jejich vyhodnocení pomocí směsice Gaussových hustotních funkcí. Praktickým výstupem práce je aplikace pro vizualizaci průběhu rozpoznávání. Návrh aplikace je multiplatformní a využívá knihoven Qt a BSAPI.
Modelování dynamiky prosodie pro rozpoznávání řečníka
Jančík, Zdeněk ; Fapšo, Michal (oponent) ; Matějka, Pavel (vedoucí práce)
V současných systémech pro rozpoznání mluvčího se zpravidla využívají krátkodobé akustické příznaky. Jiné příznaky se používají jen zřídka. V práci se zaměřím na prosodické příznaky získané z průběhu základního tónu a energie. Tyto příznaky modelují průběh základního tónu v jednotlivých fonémech nebo slabikách. Z literatury je známo, že systémy založené na prosodii neposkytují tak dobré výsledky jako akustické, ale spojením akustického systému a systému založeného na prosodii se dosáhne značného zlepšení výsledků. To ověřím spojením s akustickým systémem vyvinutým na VUT. Při experimentech použiji data z evaluací pořádaných Národním úřadem pro standardy a technologie (NIST).
Užívání glotalizace jako faktor umožňující identifikaci mluvčího
Skákal, Ladislav ; Skarnitzl, Radek (vedoucí práce) ; Bořil, Tomáš (oponent)
Při řešení úlohy identifikace mluvčího využívají forenzní fonetici kombinaci řady parametrů, které jsou obsaženy v různých vrstvách řečového signálu. Hlavním cílem předložené práce je prozkoumat, zda lze v češtině za takovýto potenciálně užitečný parametr považovat užívání glotalizace. Ve výzkumu se zaměřujeme především na míru prevokalické glotalizace na hranicích slov, přičemž rozlišujeme mezi různými podobami glotalizace: kanonickou hlasivkovou explozívou a její hypoartikulovanou podobou - třepenou fonací. Zkoumaný materiál sestává z opakovaných nahrávek tří mužů a čtyř žen, přičemž obsahuje jak čtené texty, tak spontánní projevy. Výsledky nenaznačují, že by titíž mluvčí s glotalizací nakládali v první a druhé nahrávce výrazně odlišně, zato jsou však nalezeny rozdíly v glotalizaci mezi jednotlivými mluvčími, což se z hlediska forenzní fonetiky jeví jako výhodné. Okrajově byly zkoumány i další faktory, které s osobou mluvčího přímo nesouvisejí (výška následujícího vokálu, lexikální faktory či mluvní tempo), ovšem jejich vliv na glotalizaci se prokázat nepodařilo. Klíčová slova: ráz, glotalizace, forenzní fonetika, identifikace mluvčího
Způsoby využití základní frekvence pro identifikaci mluvčích
Hývlová, Dita ; Skarnitzl, Radek (vedoucí práce) ; Šturm, Pavel (oponent)
Předkládaná diplomová práce se zabývá forenzním využitím údajů o základní frekvenci, konkrétně jejích středních hodnot a ukazatelů variability. Mezi fonetiky zabývajícími se forenzní analýzou řeči je obecně známo, že F0 nemá příliš velký potenciál jako parametr využitelný při identifikaci mluvčích, protože podléhá mnoha vnějším faktorům (jako je momentální citové rozpoložení, okolní hluk, přenosový kanál nebo dokonce vlastní snaha maskovat svůj hlas), jež zapříčiňují vysokou intraindividuální variabilitu. Přesto však platí, že forenzní užití F0 skýtá i určité výhody, například snadnost extrakce jejích hodnot ze signálu a nižší ovlivnitelnost lexikálním obsahem - na rozdíl od vokalických formantů. V této práci zkoumáme nahrávky osmi mužských mluvčích pořízené ve dvou mluvních stylech (spontánním a čteném) a porovnáváme příslušné ukazatele stability i variability základní frekvence, které jsou pokud možno robustní vůči proměnlivým vnějším okolnostem: za střední hodnoty je to základní hladina a za deskriptory variability percentilové rozpětí. Kromě toho si všímáme řečových jevů, jako je třepená fonace, které jsou idiosynkratické a napomáhají rozlišitelnosti daného mluvčího od ostatních. Klíčová slova: forenzní fonetika, identifikace mluvčího, základní frekvence, čeština
Užívání glotalizace jako faktor umožňující identifikaci mluvčího
Skákal, Ladislav ; Skarnitzl, Radek (vedoucí práce) ; Bořil, Tomáš (oponent)
Při řešení úlohy identifikace mluvčího využívají forenzní fonetici kombinaci řady parametrů, které jsou obsaženy v různých vrstvách řečového signálu. Hlavním cílem předložené práce je prozkoumat, zda lze v češtině za takovýto potenciálně užitečný parametr považovat užívání glotalizace. Ve výzkumu se zaměřujeme především na míru prevokalické glotalizace na hranicích slov, přičemž rozlišujeme mezi různými podobami glotalizace: kanonickou hlasivkovou explozívou a její hypoartikulovanou podobou - třepenou fonací. Zkoumaný materiál sestává z opakovaných nahrávek tří mužů a čtyř žen, přičemž obsahuje jak čtené texty, tak spontánní projevy. Výsledky nenaznačují, že by titíž mluvčí s glotalizací nakládali v první a druhé nahrávce výrazně odlišně, zato jsou však nalezeny rozdíly v glotalizaci mezi jednotlivými mluvčími, což se z hlediska forenzní fonetiky jeví jako výhodné. Okrajově byly zkoumány i další faktory, které s osobou mluvčího přímo nesouvisejí (výška následujícího vokálu, lexikální faktory či mluvní tempo), ovšem jejich vliv na glotalizaci se prokázat nepodařilo. Klíčová slova: ráz, glotalizace, forenzní fonetika, identifikace mluvčího

Národní úložiště šedé literatury : Nalezeno 20 záznamů.   1 - 10další  přejít na záznam:
Chcete být upozorněni, pokud se objeví nové záznamy odpovídající tomuto dotazu?
Přihlásit se k odběru RSS.