Národní úložiště šedé literatury Nalezeno 26 záznamů.  předchozí7 - 16další  přejít na záznam: Hledání trvalo 0.01 vteřin. 
Implementing and Improving a Speech Synthesis System
Beněk, Tomáš ; Szőke, Igor (oponent) ; Hannemann, Mirko (vedoucí práce)
This work deals with text-to-speech synthesis. A general theoretical introduction to TTS is~given. This work is based on the MARY TTS system which allows to use existing modules for the creation of an own text-to-speech system and a speech synthesis model using hidden Markov models trained on the created speech database. Several simple programs to ease database creation were created and adding a new language and voice to the MARY TTS system was shown hot to add. The Czech language module and voice for the MARY TTS system was created and published. An algorithm for grapheme-to-phoneme transcription was described and implemented.
Conversion of Whispered to Normal Voice
Gajda, Richard ; Černocký, Jan (oponent) ; Brukner, Jan (vedoucí práce)
The aim of this thesis is to develop a working program, that converts whispered speech input into voice using vocal excitation prediction, which is obtained from a neural network. The work is based on a study from Indian Institute of Science in Bengalore, India. The approach to the solution is the following: to acquire a dataset from training speakers, to implement the speech parameterization using the WORLD vocoder, to implement and train the neural networks, to experiment, to evaluate the results and, finally,  to propose future applications and improvements.
Realizace řečového generátoru pro embedded systémy
Kvasňák, Michal ; Macho, Tomáš (oponent) ; Petyovský, Petr (vedoucí práce)
Práce se zaobírá realizací knihovny umožňující generování hlasového výstupu pomocí vývojové desky Arduino Mega2560 rev3, ke které je připojen piezoelektrický měnič. Knihovna pracuje na logice získané pomocí analýzy programu „HLAS“ navrženého pro osobní počítač Sinclair ZX Spectrum. Výstupem práce je funkční knihovna, pro kterou je zároveň navržena výuková laboratorní úloha sloužící k seznámení se s rozhraním sériové komunikace USART.
Hlasový generátor pro pokročilé embedded systémy
Homzová, Eliška ; Macho, Tomáš (oponent) ; Petyovský, Petr (vedoucí práce)
Cílem práce je navrhnout a realizovat software zajišťující generování hlasového výstupu, který bude tvořit softwarovou knihovnu pro zvolený embedded systém. Součástí práce je přehled existujících principů generování hlasového výstupu a analýza programu Atari 520ST Speech Synthesizer V2.0. Jako vhodný embedded systém byla vybrána vývojová deska Raspberry Pi Pico.
Penetration Tests of Speaker Verification System
Wojnar, Filip ; Landini, Federico Nicolás (oponent) ; Plchot, Oldřich (vedoucí práce)
The aim of the thesis is to realize penetration tests of automatic speaker verification system with use of text-to-speech model. The thesis is focused on inner functioning of those systems and spoofing attacks against them. The thesis is also focused on speech synthesis. Later chapters are focused on realization of realized penetration tests and discussion about results they brought us.
Conversion of Whispered to Normal Voice
Gajda, Richard ; Černocký, Jan (oponent) ; Brukner, Jan (vedoucí práce)
The aim of this thesis is to develop a working program, that converts whispered speech input into voice using vocal excitation prediction, which is obtained from a neural network. The work is based on a study from Indian Institute of Science in Bengalore, India. The approach to the solution is the following: to acquire a dataset from training speakers, to implement the speech parameterization using the WORLD vocoder, to implement and train the neural networks, to experiment, to evaluate the results and, finally,  to propose future applications and improvements.
Penetrační testy systému pro verifikaci řečníka
Nguyen, QuangTrang ; Rohdin, Johan Andréas (oponent) ; Plchot, Oldřich (vedoucí práce)
Cílem bakalářské práce je návrhnout sadu penetračních testů pro verifikaci řečníka s použítím syntézy řeči a dostupných nahrávek cílových mluvčí. Práce zahrnuje studium problematiky pro syntézu řeči, verifikace řečníka a metod pro spoofing se kterými můžeme setkat. Před samotným návrhem testovací sady je popsán systém a jeho komponenty, který byl použít v této práci. V posledních kapitolách práce je uveden popis návrhu testovacích sad a způsob realizace testů. Na závěru jsou vyhodnoceny výsledky a je odpovězeno na otázku, zda je možné prolomit systém pro verfikaci řečníka s využitím metody pro syntézu řeči.
Efficient neural speech synthesis
Vainer, Jan ; Dušek, Ondřej (vedoucí práce) ; Hajič, Jan (oponent)
Modely pro práci se sekvenčními daty založené na neuronových sítích v posledních letech výrazně přispěly ke zlepšení kvality systémů pro syntézu řeči. Zatím však nebyl navržen systém, který by se dal rychle a efektivně natrénovat, byl schopen rychlé syntézy a zároveň generoval hlas ve vysoké kvalitě. V této diplomové práci představujeme systém pro syntézu řeči založený na neuronových sítích, který je schopen generovat spektrogramy v reálném čase, má nízké nároky na výpočetní kapacity a je rychle trénovatelný. Náš systém sestává ze dvou neuronových sítí- ze studenta a z učitele. Učitel je využit k aproximaci zarovnání mezi textem, z něhož má být generována mluvená řeč, a mezi korespondujícím spektrogramem. Student využívá získaná zarovnání pro efektivní syntézu spektrogramů z fonet- ické reprezentace vstupního textu. Obě sítě využívají jednoduché konvoluční vrstvy. Náš systém trénujeme na anglické datové sadě LJSpeech. Systém je schopen generovat řeč v reálném čase na běžném procesoru a je možné jej rychle natrénovat na jedné graické kartě. Kvalita řeči generované z našeho systému byla ohodnocena jako signifikantně vyšší v porovnání s konkurenčními systémy. 1
Multilingual speech synthesis
Nekvinda, Tomáš ; Dušek, Ondřej (vedoucí práce) ; Peterek, Nino (oponent)
Tato práce se zabývá vícejazyčnou syntézou řeči. Porovnali jsme tři odlišné modely, které jsou založeny na Tacotronu. Tyto modely se liší především v přístupu ke sdílení infor- mací a parametrů mezi jazyky. Dva z nich navazují na současné systémy pro vícejazyčnou konverzi textu na řeč. První využívá plně sdíleného enkodéru a doménově specifického klasifikátoru, který je modifikovaný za účelem odstranění informací, které závisí na syn- tetizovaném hlase, z enkodéru. Druhý model používá separátní enkodér pro každý jazyk. V této práci navrhujeme nový přístup, který kombinuje nejlepší z obou zmíněných metod. Díky technikám metaučení umožnujě efektivní sdílení parametrů při zachování flexibility. Tyto tři modely porovnáváme na dvou úlohách. Jedna z nich se zaměřuje na sdružené vícejazyčné učení na deseti jazycích a odhaluje možnosti porovnávaných modelů sdílet znalosti mezi jazyky. Druhá se zabývá syntézou vět, které obsahují výrazy z několika různých jazyků. Dokládáme, že náš nový přístup umožˇuje efektivní sdílení informace mezi jazyky a že dle subjektivního hodnocení produkuje přirozenější řeč bez častých přeřeků a chyb ve výslovnosti.
Voice Conversion
Lukáč, Peter ; Glembek, Ondřej (oponent) ; Černocký, Jan (vedoucí práce)
The matter of this thesis is voice conversion. Voice conversion is taking speech of one speaker, that we call source speaker and transforming it into speech that sounds as the speech of another speaker, that we call target speaker. This is accomplished using voice conversion system described in this thesis. As the framework for speech analysis and synthesis, we are using tool called STRAIGHT that was predominantly used in Voice Conversion Challenge 2016. Our voice conversion system is based on spectral conversion using feed-forward neural network and parallel training.

Národní úložiště šedé literatury : Nalezeno 26 záznamů.   předchozí7 - 16další  přejít na záznam:
Chcete být upozorněni, pokud se objeví nové záznamy odpovídající tomuto dotazu?
Přihlásit se k odběru RSS.