Národní úložiště šedé literatury Nalezeno 33 záznamů.  1 - 10dalšíkonec  přejít na záznam: Hledání trvalo 0.00 vteřin. 
Moderní řečové příznaky používané při diagnóze chorob
Bílý, Ondřej ; Smékal, Zdeněk (oponent) ; Mekyska, Jiří (vedoucí práce)
Tato práce se zabývá diagnózou Parkinsonovy choroby na základě analýzy řečového signálu. Na začátku práce je popsána tvorba řečového signálu. Následuje popis analýzy řečového signálu, jeho předzpracování a následná extrakce příznaků. Dále je popsána Parkinsonova choroba a změna řečového signálu při tomto postižení. V následující části jsou popsány příznaky, které se používají pro diagnózu Parkinsonovy choroby (FCR, VSA, VOT atd.). Další část práce se zabývá metodami redukce a výběru příznaků pomocí učících se algoritmů (SVM, ANN, k-NN) a jejich následné ohodnocení. V poslední části diplomové práce je popsán vytvořený program pro počítání příznaků. Dále je popsán výběr příznaků a na konec jsou zhodnoceny všechny dosažené výsledky.
Rozpoznávání emočních stavů na základě analýzy řečového signálu
Čermák, Jan ; Atassi, Hicham (oponent) ; Smékal, Zdeněk (vedoucí práce)
Obsah této práce je zaměřen na klasifikaci emočních stavů s použitím neuronových sítí a klasifikátoru na bázi směsi Gaussových hustotních funkcí s využitím programu Matlab. Pojednává o problematice zpracování řečového signálu, z něhož byly extrahovány prozodické, spektrální příznaky a MFCC koeficienty. Práce se zabývá určením kvality jednotlivých příznaků a výběrem nejvhodnějších pro správnou klasifikaci emočních stavů. Pro určení emočních stavů byly použity dvě rozdílné metody. První metodou jsou neuronové sítě s různě zvolenými parametry. Druhou metodou klasifikace je použití smíšených Gaussových modelů tzv. GMM. U obou metod byla pro klasifikaci rozdělena databáze emočních promluv na trénovací a testovací skupinu. Při testování byla využita metoda nezávislá na mluvčím. Součástí práce je porovnání jednotlivých analyzovaných postupů, zobrazení a porovnání výsledků. Závěrem práce je návrh nejvhodnějších parametrů a klasifikátoru pro rozpoznání emočního stavu mluvčího.
Lineární predikční a kepstrální syntéza řečového signálu v systému TTS
Mekyska, Jiří ; Stejskal, Vojtěch (oponent) ; Smékal, Zdeněk (vedoucí práce)
Práce se zabývá lineární predikční a kepstrální syntézou řečového signálu v systémech TTS (Text-to-Speech) s možností modelování prozodie. Je zde uveden popis řečového signálu v akustické a fonetické rovině, princip tvorby řeči a způsob znázornění řečového signálu v časové a kmitočtové oblasti. Dále je zde uvedena bloková stavba TTS systémů, přičemž každý blok je zvlášť detailně popsán. V práci je také popsána problematika modelování prozodie pomocí tří nejdůležitějších suprasegmentálních rysů (základní tón, trvání a intenzita řeči). Na konci je proveden návrh a realizace univerzálního českého TTS systému, který je založen na syntéze řeči v kmitočtové oblasti. Tento systém je implementován v programu MATLAB.
Rozpoznávání a klasifikace emocí na základě analýzy řeči
Černý, Lukáš ; Atassi, Hicham (oponent) ; Smékal, Zdeněk (vedoucí práce)
Diplomová práce se soustředí na klasifikaci emocí. Práce pojednává o parametrizaci zvukových souborů pomoci segmentálních a suprasegmentálních metod s ohledem na jejich další použití. Tato databáze obsahuje mnoho zvukových nahrávek s emocemi. Z těchto zvukových nahrávek jsou vytvořeny data, které jsou rozděleny do dvou částí. První část je použita pro trénik a druhá pro klasifikaci. Práce je soustředěna hlavně na samoorganizující sítě. Tato práce obsahuje programy v Matlabu, které mohou být použity pro parametrizaci jakékoliv databáze. Parametrizovaná data jsou předložena samoorganizující síťi ke klasifikaci. Dosažené výsledky jsou prezentovány na konci diplomové práce.
Databáze emoční řeči
Hlavica, Michal ; Přinosil, Jiří (oponent) ; Atassi, Hicham (vedoucí práce)
V této bakalářské práci je rozebrána teorie emocí, to jak emoce vznikají a jak jsou fyziologicky vyjádřeny lidským tělem. Jak se tyto fyziologické projevy a emoce vůbec promítají do lidské řeči. Dále je popsán proces tvorby řeči a základní prozodické a akustické parametry hlasového projevu relevantní pro výzkum. Je zde také popsána teorie tvorby databází zvukových nahrávek, což je kvalitní podklad pro databázi samotnou. Ta je totiž také součástí této práce a jedná se o nahrávky stříhané z televizních pořadů a seriálů. Dalším velice důležitým bodem je popsání softwarového nástroje pro subjektivní hodnocení databází, který byl vytvořen jako součást této práce. Byl vytvořen v jazyce C++ za pomoci kompilátoru Builder C++. Také je zde provedena krátká analýza ukázkových nahrávek pro každou emoci. Tato analýza se zabývá základní frekvencí, intenzitou a prvními třemi formanty.
Multilingual analysis of human emotional states
Rendek, Tomáš ; Koula, Ivan (oponent) ; Atassi, Hicham (vedoucí práce)
This work deals with the properties of the speech signal. At the beginning it introduces a process of generation of the speech. Then, it covers the prosodic features of the speech, which represent a related characteristic of emotions. It defines an emotion itself, as well as the basic features and parameters of the human speech. For the analysis we use the program called Praat. As it is an unknown program, we devote a part of the work to it, which acquaints us with its advantages. The next part of this paper comprises also two enclosed databases containing records of particular emotional states of human. These databases were created and collected for Slovak and German language. However, none of them contain spontaneous material. Next, the work concerns a concept of the neural networks. It regards it as a possible realization of recognizing of emotional characteristics. The initial analysis presents large number of gained features, out of which only the best twelve were selected on the basis of geometric separability. These features are distinct for both sexes, as well as for both nationalities. Consequently, they are used for training with a neural network. The work concludes by summarizing of the results discussing the successfulness with recognition of emotional states. It also gives possible reasons which lead to degradation of their successful classifying. The thesis contains a CD with all the partial and ultimate results, and files with records for Slovak and German language.
Aplikace pro výpočet řečových příznaků popisující hypokinetickou dysartrii
Hynšt, Miroslav ; Mekyska, Jiří (oponent) ; Kiska, Tomáš (vedoucí práce)
Tato práce se zabývá návrhem a zhotovením aplikace pro výpočet řečových parametrů u lidí trpící Parkinsonovou nemocí. Na začátku je obecně popsána Parkinsonova nemoc a Hypokinetická dysartrie a jak ovlivňuje řeč a parametry řeči při jejím postižení. Rozebrány jsou hlavně oblasti jako fonace, prozodie, artikulace a plynulost řeči. Dále práce popisuje parametry s velkým významem při diagnostice této nemoci a jejím postupu. Zmíněny a popsány jsou i některé významné studie ve světě popisující průběh vyšetření řeči účastníků a výpočet některých řečových parametrů za účelem analýzy řeči lidí postižených Parkinsonovou nemocí. Součástí práce je navržená a implementovaná aplikace pro výpočet, export a vizualizaci řečových parametrů z vybraných zdrojových zvukových nahrávek.
Automatické rozpoznávání emočních stavů člověka na základě analýzy řečového projevu
Pfeifer, Leon ; Atassi, Hicham (oponent) ; Smékal, Zdeněk (vedoucí práce)
Diplomová práce se zabývá charakteristikou metod pro analýzu emočních stavů člověka. Práci lze rozdělit do tří částí. V první je charakterizován řečový projev z fonetického a psychologického aspektu. V druhé části jsou zpracovány analyzované metody a věci související (předzpracování signálu, řečový detektor). Pro výpočet základního tónu řeči byla použita metoda centrálního klipování, další použitou metodou je analýza na základě formantových frekvencí a poslední metoda určování počtu vrcholů a rovin. Ve třetí části jsou zpracovány výsledky měření provedené jednotlivými metodami Vyhodnocováno zde bylo pět různých emočních stavů: neutralita, vztek, radost, smutek a překvapení. Jsou zde vyobrazeny a diskutovány výsledky pro každou metodu.
Multiplatformní brána pro hlasovou komunikaci v reálném čase
Starzyczny, Radek ; Krkoš, Radko (oponent) ; Novotný, Bohumil (vedoucí práce)
Tato diplomová práce je zaměřena na VoIP komunikaci. Popisuje zprovoznění operačního systému OpenWRT, analogového rozhraní TAPI směrovače Gigaset SX762 a GSM brány pro příjem či spojování odchozích hovorů. V práci jsou popsány protokoly podílející se na komunikaci a také základní konfigurace prvků. Nasazení IP telefonie umožňuje snížit náklady na provoz a poskytuje množství přídavných funkcí.
Modelování dynamiky prosodie pro rozpoznávání řečníka
Jančík, Zdeněk ; Fapšo, Michal (oponent) ; Matějka, Pavel (vedoucí práce)
V současných systémech pro rozpoznání mluvčího se zpravidla využívají krátkodobé akustické příznaky. Jiné příznaky se používají jen zřídka. V práci se zaměřím na prosodické příznaky získané z průběhu základního tónu a energie. Tyto příznaky modelují průběh základního tónu v jednotlivých fonémech nebo slabikách. Z literatury je známo, že systémy založené na prosodii neposkytují tak dobré výsledky jako akustické, ale spojením akustického systému a systému založeného na prosodii se dosáhne značného zlepšení výsledků. To ověřím spojením s akustickým systémem vyvinutým na VUT. Při experimentech použiji data z evaluací pořádaných Národním úřadem pro standardy a technologie (NIST).

Národní úložiště šedé literatury : Nalezeno 33 záznamů.   1 - 10dalšíkonec  přejít na záznam:
Chcete být upozorněni, pokud se objeví nové záznamy odpovídající tomuto dotazu?
Přihlásit se k odběru RSS.