keywords:"speaker identification" - Výsledky hledání - Digitální repozitář

host :: přihlásit Digitální repozitář
		Hledej		Nový záznam		Nápověda		O repozitáři

Hlavní stránka > Výsledky hledání: keywords:"speaker identification"

Hledej:

Tipy pro vyhledávaní :: Rozšířené hledání

Hledej ve sbírkách:

Seřadit podle:	Zobrazit výsledky:	Výstupní formát:

	Využití dlouhodobé formantové distribuce pro rozpoznatelnost mluvčího v různých akustických podmínkách Lazárková, Dita ; Skarnitzl, Radek (vedoucí práce) ; Bořil, Tomáš (oponent) Analýza dlouhodobé formantové distribuce (LTF) je poměrně mladou, ale slibnou disciplínou identifikace mluvčích. Jde o metodu mapující dlouhodobé chování formantů v řeči jednotlivých mluvčích. Častými problémy, s nimiž se v praxi setkáváme, je zhoršená akustická kvalita a příliš krátké trvání zkoumaných nahrávek. Tato práce má za cíl představit historický vývoj forenzní fonetiky a současné používané metody. V praktické části se zabýváme využitelností LTF metody ve forenzní praxi, zvláště pak u nahrávek obsahujících šum v pozadí. Ukázalo se, že šum extrahované LTF hodnoty znatelně ovlivňuje, bohužel nejde o žádné systematické změny. Proto jsme navrhli několik metod, jak šum v nahrávce kompenzovat, aby bylo možné navzájem srovnávat i čisté a zašuměné nahrávky. Zkoumali jsme též minimální trvání nahrávky, jež je nutné pro statistickou spolehlivost výsledných hodnot. Tato hranice není přesná a je pro jednotlivé mluvčí značně individuální, ale je patrné, že nahrávky (vokalické proudy) kratší než 15 s mají již často sníženou vypovídající hodnotu, nelze je tedy pro analýzu doporučit. Klíčová slova: LTF, dlouhodobá formantová distribuce, identifikace mluvčích, forenzní fonetika, akustická kvalita nahrávky, šum Úplný záznam
	Identifikace mluvčího v temporální doméně řeči Weingartová, Lenka ; Volín, Jan (vedoucí práce) ; Skarnitzl, Radek (oponent) ; Pollák, Petr (oponent) Tato práce si klade za cíl zevrubně popsat temporální charakteristiky mluvené češtiny prostřednictvím trvání hlásek a jejich změn pod vlivem několika prozodických i segmentálních faktorů, jako je pozice ve vyšší jednotce (slabice, slově či prozodické frázi), délka vyšší jednotky, hláskové okolí, struktura slabiky či frázové zpomalování. Řečový materiál pochází z korpusu semispontánních dialogů, který obsahuje 4046 promluv od 34 mluvčích. Deskripce jsou následně využity pro vytvoření temporálního modelu založeného na pravidlech, který slouží jako srovnávací báze pro analýzu kontur lokálního artikulačního tempa a jejich specifičnosti pro mluvčího. Výsledky naznačují, že systematické rozdíly mezi mluvčími se dají nalézt jak v segmentální doméně, tak i v temporálních konturách. Dále je také posouzen potenciál artikulačního tempa a globálních temporálních ukazatelů pro indentifikaci mluvčího. Klíčová slova: temporální charakteristiky, temporální modelování, trvání hlásek, identifikace mluvčího, čeština Úplný záznam
	Využití knihovny ALIZE pro identifikaci mluvčích Skulínek, Zdeněk ; Burget, Radim (oponent) ; Přinosil, Jiří (vedoucí práce) V posledních letech, kdy dochází k výraznému nárůstu výkonu počítačů, se na popředí dostaly mimo jiné i systémy pro rozeznávání mluvčího. Vznikla řada knihoven, ať již open--source či proprietárních, které se této problematice věnují. Jednou z takových knihoven je například ALIZE, která byla vyvinuta na univerzitě v Avignonu. Tato knihovna nabízí obecný koncept práce s biometrickými údaji, statistickými výpočty a kompletní framework pro zamýšlenou aplikaci. Úkolem této práce je tuto knihovnu vyzkoušet, a to postavením praktické aplikace pro rozeznávání mluvčího. Tato práce popisuje úspěšné sestavení této aplikace. Aplikace je platformně nezávislá a je také vyzkoušená na všech třech základních platformách. Ty jsou přílohou práce jako soubory do virtuálního stroje VirtualBox. Práce si všímá praktických zkušeností s knihovnou ALIZE, popisuje její strukturu a architekturu. Pro testování je použito celkem 50 vzorků od 9ti mluvčích, v délkách okolo 20ti sekund. Pro tyto délky funguje rozeznávání naprosto spolehlivě s dodanými vzorky. Proto je na závěr v tezi uskutečněn test skutečné délky potřebné k rozeznání mluvčího. Úplný záznam
	Rozpoznávání mluvčího Kašpar, Ladislav ; Atassi, Hicham (oponent) ; Sysel, Petr (vedoucí práce) Ve své bakalářské práci se věnuji problému rozpoznávání mluvčího. Tato práce obsahuje základní teorie k tomuto tématu. Teorie je zaměřena na výpočet parametrů pro rozpoznávání mluvčího a na popis postupu při rozpoznávání mluvčího. Jako hlavní parametry v programu na rozpoznávání mluvčího napsaného v jazyce Matlab využívám kmitočty formantů, kepstrální koeficienty a segmentaci signálu. Úplný záznam
	Speaker Recognition on Mobile Phone Pešán, Jan ; Glembek, Ondřej (oponent) ; Černocký, Jan (vedoucí práce) This work aims to port Speaker Identification System (SID) to the mobile device / mobile phone. We will describe basic principles, function and implementation of speaker identification system on Nokia N900 mobile phone. Úplný záznam
	Modelování dynamiky prosodie pro rozpoznávání řečníka Jančík, Zdeněk ; Fapšo, Michal (oponent) ; Matějka, Pavel (vedoucí práce) V současných systémech pro rozpoznání mluvčího se zpravidla využívají krátkodobé akustické příznaky. Jiné příznaky se používají jen zřídka. V práci se zaměřím na prosodické příznaky získané z průběhu základního tónu a energie. Tyto příznaky modelují průběh základního tónu v jednotlivých fonémech nebo slabikách. Z literatury je známo, že systémy založené na prosodii neposkytují tak dobré výsledky jako akustické, ale spojením akustického systému a systému založeného na prosodii se dosáhne značného zlepšení výsledků. To ověřím spojením s akustickým systémem vyvinutým na VUT. Při experimentech použiji data z evaluací pořádaných Národním úřadem pro standardy a technologie (NIST). Úplný záznam
	Multiplatformní aplikace pro verifikaci mluvčího Görig, Jan ; Matějka, Pavel (oponent) ; Glembek, Ondřej (vedoucí práce) Bakalářská práce se zabývá rozpoznáváním mluvčího bez znalosti textu sdělení. Zmiňuje dnes používané způsoby extrakce příznaků a jejich vyhodnocení pomocí směsice Gaussových hustotních funkcí. Praktickým výstupem práce je aplikace pro vizualizaci průběhu rozpoznávání. Návrh aplikace je multiplatformní a využívá knihoven Qt a BSAPI. Úplný záznam
	Rozpoznávání mluvčího ve Skype hovorech Kaňok, Tomáš ; Glembek, Ondřej (oponent) ; Schwarz, Petr (vedoucí práce) Tato diplomová práce se zabývá problematikou strojové identifikace a verifikace řečníka, její teorií a aplikací. Vyhodnocuje existující implementaci dané problematiky skupinou Speech@FIT. Dále se zabývá problematikou tvorby zásuvných modulů do komunikačního programu Skype. Následně je navržen zásuvný modul pro Skype umožňující identifikaci a verifikaci řečníka. Ten je implementován a vyhodnocen. V závěru jsou uvedeny návrhy dalšího vývoje. Úplný záznam
	Intersession Variability Compensation in Language and Speaker Identification Hubeika, Valiantsina ; Burget, Lukáš (oponent) ; Matějka, Pavel (vedoucí práce) Varibiality in the channel and session is an important issue in the text-independent speaker recognition task. To date, several techniques providing channel and session variability compensation were introduced in a number of scientic papers. Such implementation can be done in feature, model and score domain. Relatively new and powerful approach to remove channel distortion is so-called eigenchannel adaptation for Gaussian Mixture Models (GMM). The drawback of the technique is that it is not applicable in its original implementation to different types of classifiers, eg. Support Vector Machines (SVM), GMM with different number of Gaussians or in speech recognition task using Hidden Markov Models (HMM). The solution can be the approximation of the technique, eigenchannel adaptation in feature domain. Both, the original eigenchannel adaptation and eigenchannel adaptation on features in task of speaker recognition are presented. After achieving good results in speaker recognition, contribution of the same techniques was examined in acoustic language identification system with $14$ languages. In this task undesired factors are channel and speaker variability. Presented results are presented on the NIST Speaker Recognition Evaluation 2006 data and NIST Language Recognition Evaluation 2007 data. Úplný záznam
	Vybrané rozšířené příspěvky z mezinárodní konference CSIT 2006 (Počítačové vědy a informační technologie) - speciální číslo časopisu NNW Húsek, Dušan ; Snášel, V. ; El-Qawasmeth, E. Editoři presentují rozšířené verze nejlepších příspěvků ze 4th International Multiconference on Computer Science and Information Technology 2006 (CSIT 2006). Na této konferenci byly presentovány nejnovější nejnovější poznatky z různých oblastí výpočetní techniky. Články uveřejněné v tomto speciálním čísle časopisu se týkají především oblasti umělé inteligence a znalostního inženýrství s důrazem na biologicky motivované metody a neuronové sítě. (Neural Network World 16, 4 (2006) 275-368.) Úplný záznam

Chcete být upozorněni, pokud se objeví nové záznamy odpovídající tomuto dotazu?
Přihlásit se k odběru RSS.

Digitální repozitář :: :: :: ::
Powered by v1.1.2
Spravuje

Tato stránka je dostupná také v následujících jazycích:
Česky English