Národní úložiště šedé literatury Nalezeno 28 záznamů.  začátekpředchozí21 - 28  přejít na záznam: Hledání trvalo 0.01 vteřin. 
Codec Detection from Speech
Jon, Josef ; Matějka, Pavel (oponent) ; Černocký, Jan (vedoucí práce)
This thesis deals with codec detection from compressed speech signal. The primary goal was to identify which features distinguish selected codecs, and then create an environment facilitating experiments with various types of classifiers and their configurations. Support vector machines and neural networks, modeled using the Keras library, were used. The main contribution of this work is the experimental part, in which the effects of the neural networks parameters are discussed. After tuning the parameters and finding their optimal values, the network achieved accuracy over 98% on a test set comprising data from six different codecs.
Konverze hlasu
Hodaň, David ; Novotný, Ondřej (oponent) ; Černocký, Jan (vedoucí práce)
Práce se zabývá problematikou konverze hlasu, což je transformace parametrů řeči jednoho řečníka tak, aby zněl jako někdo jiný. Je proveden rozbor metod odrážejících současný stav technik konverze. V teoretické části je nejprve přiblížen způsob tvorby řeči s důrazem na atributy identifikující a charakterizující hlas. Jsou popsány metody modifikace hlasu s jejich výhodami a úskalími, jež předurčují oblast použití daných metod. Dále jsou probrány způsoby transformace hlasu mezi zdrojovým a cílovým mluvčím. Na základě popsaných poznatků je vytvořen software demonstrující jednu z cest jak tohoto cíle dosáhnout. Konverze je rozdělena z pohledu trénování a syntézy. Součástí práce je program konverze hlasu, který byl vytvořen v programovém prostření MATLAB. Postupně je v práci popsán jeho návrh, implementace a zhodnocení dosažených výsledků.
Shluková analýza v oblasti číslicového zpracování patologické řeči
Čapek, Karel ; Mžourek, Zdeněk (oponent) ; Galáž, Zoltán (vedoucí práce)
Tato bakalářská práce se zabývá výpočtem parametrů kvantifikujících degradaci řečové produkce způsobenou přítomností určité řečové patologie a následným rozřazením uvažovaných patologií do skupin pomocí algoritmu k-means. Účelem bylo nalezení skupin patologií, které navzdory možnému rozdílnému původu v podobné míře postihují fonační a artikulační schopnosti řečníka a znehodnocují kvalitu řeči jako takové. V práci bylo využito fonaci hlásky „a“, jako nejběžněji se vyskytujícího řečového cvičení, kvůli své odolnosti vůči demografickým a lingvistickým charakteristikám jednotlivých řečníků. Dále je na parametry uplatněna předběžná analýza, která má za úkol vybrat parametry nejlépe charakterizující degradaci řečové promluvy. Nakonec jsou tyto vybrané parametry použity pro nalezení výsledných dělení patologií pomocí algoritmu k-means.
Implementace detektoru klíčových slov do mobilního telefonu (Symbian 60)
Cipr, Tomáš ; Schwarz, Petr (oponent) ; Szőke, Igor (vedoucí práce)
Detektor klíčových slov je jednou z aplikací automatického rozpoznávání řeči. Úkolem detektoru je určit, ve kterých místech souvislého toku řeči se vyskytují slova ze zadaného seznamu. Detektor klíčových slov najde řadu uplatnění mimo jiné i v mobilních telefonech, např. pro jejich ovládání hlasem. S nástupem OS Symbian se otevřela možnost jak detektor implementovat i pro tato zařízení. Zpráva popisuje jednak teoretická a odborná východiska realizace detektoru a také jeho následnou implementaci. Nejdříve je uveden operační systém Symbian s ohledem na praktické řešení úkolu. Dále je popsán způsob detekce klíčových slov od vstupního řečového signálu až po výstup, zda a která slova byla nalezena. Následně je prezentován objektový návrh detektoru a podrobněji popsána jeho implementace. Závěrem jsou shrnuty dosažené výsledky a nastíněn další vývoj.
Webový prohlížeč přednášek
Žižka, Josef ; Mikolov, Tomáš (oponent) ; Fapšo, Michal (vedoucí práce)
Tato práce se zabývá webovým prohlížečem přednášek, jehož cílem je usnadnit přístup k informacím s využitím moderních řečových a multimediálních technologií. Jsou rozebrány jednotlivé technologie, na kterých je prohlížeč postaven. Významnou roli v prohlížeči představují videozáznamy, a proto je velká část této práce zaměřena na digitální video a způsoby jeho doručení skrze streaming servery.  Jsou uvedena řešení podobně stavěných multimediálních prohlížečů. Čtenář je seznámen s návrhem prohlížeče. Toto zahrnuje popis jeho jednotlivých komponent a je vysvětlena jejich vzájemná synchronizace. Je představena výsledná verze prohlížeče přednášek, jsou zmíněny problémy, které se vyskytly v průběhu jeho vývoje a při nasazení prohlížeče do reálného provozu. Na konci práce je diskutován budoucí vývoj webového prohlížeče přednášek.
Vizualizace výstupu z řečových technologií pro potřeby kontaktních center
Zhezhela, Oleksandr ; Szőke, Igor (oponent) ; Schwarz, Petr (vedoucí práce)
Diplomová práce se zabývá vizualizací dat získaných pomocí řečových technologií pro potřeby kontaktních center. Jsou prozkoumány metody získávání informaci z řečových signálů a existující nástroje, které řeší podobné úlohy. Je analyzován rozsah dat, která lze z řečových technologií získat. Procesy a standardy používané v kontaktních centrech. Na základě požadavků pracovníků kontaktních center bylo implementováno uživatelské rozhraní pro vizualizaci dat a audio přehrávačznázorňující řečová data. Získané poznatky a řešení byly implementovány do nástroje Speech Analytics Server (SPAS).
Tvorba zvuku v technologii VST
Švec, Michal ; Schimmel, Jiří (oponent) ; Černocký, Jan (vedoucí práce)
Tato diplomová práce se zabývá problematikou digitální zvukové syntézy. Jejím hlavním úkolem bylo navrhnout a implementovat nový zvukový syntezátor. Vytvořený nástroj využívá různé přístupy k syntéze zvuku, proto je ho možné označit jako hybridní. Návrh nástroje byl inspirován existujícími audio syntezátory. Pro implementaci byl zvolen jazyk C++ a technologie VST od společnosti Steinberg. Jako rozšíření byl navržen a realizován modul, který dokáže zpracovat hlasový nebo textový vstup a na jeho základě vytvořit MIDI soubor, který je možné pomocí syntezátoru interpretovat. Pro tento modul je použitý jazyk Python. K vytvořenému syntezátoru vzniklo i jednoduché uživatelské rozhraní.
Mobile platform for testing of automotive systems in Bluetooth Hands-Free communication
Mecerod, Václav ; Stifter, Jiří (oponent) ; Kratochvíl, Tomáš (vedoucí práce)
This master’s thesis deals with the main issues of the Hands-Free communication systems implementation in the automotive industry. The first chapter focuses on the theoretical aspects of speech processing in embedded applications, such as noise suppressing, acoustic echo cancelation and Hands-Free performance in general. The second chapter includes the design of compact flexible mobile testing tools for wireless communication Hands-Free modules.

Národní úložiště šedé literatury : Nalezeno 28 záznamů.   začátekpředchozí21 - 28  přejít na záznam:
Chcete být upozorněni, pokud se objeví nové záznamy odpovídající tomuto dotazu?
Přihlásit se k odběru RSS.