Národní úložiště šedé literatury Nalezeno 240 záznamů.  začátekpředchozí21 - 30dalšíkonec  přejít na záznam: Hledání trvalo 0.01 vteřin. 
Porovnání analýzy řečového signálu v závislosti na věku a pohlaví mluvčího
Báňa, Josef ; Smékal, Zdeněk (oponent) ; Atassi, Hicham (vedoucí práce)
Obsah této práce je zaměřen na analýzu věku a pohlaví. Dále pak byli zkoumány vhodnosti příznaků a vhodnost jejich použití při klasifikaci mluvčích. Je v ní pojednáno o základní teorii řečového signálu a problematice zobrazení a zpracování řeči. Je zde popsán volně dostupný program Praat, kterým se používá pro řečovou analýzu. Zaměřili jsme se na suprasegmentální příznaky řeči. Dále je zde popsána teorie příznaků které byly pro práci zvoleny. Prvním z kroků v této práci bylo získání dostatečného počtu promluv (nahráváním) od mluvčích různého věku a pohlaví. Řečový korpus je poměrně obsáhlý. Mluvčí byli rozděleni do šesti věkových skupin. Dále byly nahrávky zpracovány v programu Praat. Průměrné hodnoty byly vyneseny do tabulek a sloupcových grafů pro větší přehlednost. Dále bylo vybráno dvanáct nejvhodnějších příznaků podle kritéria kvality. S nimi poté byla provedena analýza zvolených příznaků pro automatické rozpoznávání pohlaví a věku. Příznaky byly při testování po jednom ubírány. Jako klasifikátor pro rozpoznávání byla zvolena neuronová sít. Pro práci se sítí byl zvolen Neural Network Toolbox v programu Matlab. Vytvořené sítě byly použity pro klasifikaci mluvčích na základě věku a pohlaví. Výsledky byly rozebrány v závěru práce.
Jednoduchý diktovací systém
Hromádko, Michal ; Schwarz, Petr (oponent) ; Szőke, Igor (vedoucí práce)
Tato diplomová práce se zabývá návrhem a tvorbou jednoduchého diktovacího systému. Vysvětluje metody používané pro rozpoznávání řeči a popisuje existující systémy. Návrh systému je zaměřen především na tvorbu gra fického uživatelského rozhraní s velkým důrazem na ergonomii ovládání.
Detekce klíčových slov v řečových signálech
Pfeifer, Václav ; Makáň, Florian (oponent) ; Dostál, Otto (oponent) ; Balík, Miroslav (vedoucí práce)
Systémy pro zpracování řečových signálů jsou vyvíjeny již delší dobu, ale až s nástupem výkonných výpočetních systémů se začalo s integrací těchto systémů do praxe. Tato disertační práce se zabývá návrhem systému pro detekci klíčových slov v řečových signálech. Navržený systém principiálně vychází z Large Margin and Kernel metod a klíčovou součástí systému je fonémový klasifikátor. Byly navrženy dva hierarchické klasifikátory – lineární a nelineární, spolu s efektivním trénovacím algoritmem. Současně byl navržen klasifikátor založený na „Gaussian Mixture Models“ s implementací hierarchické struktury. Důležitou součástí detekčního systému je extrakce příznaků, a proto byl navržený systém vyhodnocen na současně nejrozšířenějších extrakčních metodách. Součástí technického řešení práce byla implementace detekčního systému v prostředí MATLABU a návrh hierarchické fonémové struktury pro Český jazyk. Všechny algoritmy byly vyhodnoceny pro Český a Anglický jazyk na databázích (DBRS a TIMIT)
On-line editor anotací se zobrazením audia
Dorotovič, Viktor ; Herout, Adam (oponent) ; Szőke, Igor (vedoucí práce)
Cílem této práce je vytvořit webový editor, který vedle přepisovaného textu zobrazuje i waveform, a tím usnadňuje orientaci v audiu. Pro zobrazení waveformu byla vyvinuta knihovna, která s použitím elementu canvas ze specifikace HTML5 zobrazuje průběh signálu s možností skrolování a přibližování. Ve waveformu jsou přímo vyznačeny anotace a poloha přepisovaného textu je synchronizována s umístěním anotace v audiu. Cílem je nahradit stávající editor novým, byl proto proveden uživatelský test, který je porovnal. Čas potřebný pro naučení obsluhy aplikace a přepis krátké nahrávky se snížil o 20%. Knihovna pro zobrazení waveformu byla uvolněna pod open source licencí.
Hlasové kodéry pro nízké přenosové rychlosti
Leitner, Jakub ; Mačák, Jaromír (oponent) ; Pust, Radim (vedoucí práce)
Diplomová práce se zabývá problematikou kodérů a vokodérů používaných ve zpracování řečového signálu. Cílem práce je vytvořit ucelenený přehled koderů a vokodérů včetně popisu jejich vlastností, v druhé části pak simulace algoritmů a metod pro zpracování řeči v programu Matlab Simulink. Simulovány byly základní metody pro zpracování řeči v časové oblasti a parametrický LPC vokodér. V modelu LPC vokodéru je implementováno několik algoritmů pro získání příznaků neboli parametrů segmentu řečového signálu. Jsou to: metoda pro určení znělosti segmentu řečového signálu, LPC analýza, odhad frekvence základního tónu řeči. Výstupem je tedy parametrizovaný signál, z něhož je možné na přijímací straně řečový signál obnovit. V příloze na konci práce je uvedena tabulka názvů kodérů, případně číslo normy ve které je kodér standardizován, a jejich vlastnosti. Druhou přílohou je přehled metod zpracování řečového signálu.
Diagnóza Parkinsonovy choroby z řečového signálu
Karásek, Michal ; Smékal, Zdeněk (oponent) ; Mekyska, Jiří (vedoucí práce)
Práce se zabývá rozpoznáním Parkynsonovy choroby z řečového signálu. V první části poukazuje na základy řečových signálů a řečových signálů u pacientů postižených Parkinsonovou chorobou. Dále popisuje problematiku zpracování řečových signálů, základní příznaky používané k diagnóze Parkinsonovy choroby (např. VAI, VSA, FCR, VOT atd.) a redukci těchto příznaků. Další část je zaměřena na blokové schéma programu pro diagnózu Parkinsonovy choroby. Hlavním cílem této práce je porovnání dvou metod výběru příznaků (mRMR a SFFS). Pro klasifikaci byly vybrány dvě rozdílné metody. První metodou je klasifikace kNN a druhou metodou klasifikace jsou Gaussovy smýšené modely (GMM).
Změna rychlosti (synchronizace) přehrávání videa v závislosti na rychlosti řeči
Hromádko, Michal ; Fapšo, Michal (oponent) ; Szőke, Igor (vedoucí práce)
Tato bakalářská práce se zabývá rozšířením přehrávače VLC o metodu PSOLA. Tato metoda umožňuje měnit rychlost přehrávání videa při zachování základního tónu a srozumitelnosti řeči.
Odhad přesnosti řečových technologií na základě měření signálové kvality a obsahové bohatosti audia
Nezval, Jiří ; Smital, Lukáš (oponent) ; Schwarz, Petr (vedoucí práce)
Práce se zabývá teoretickým rozborem vzniku řeči, představuje možnosti využití řečových technologií a vysvětluje současný přístup k fonetickému přepisu řečových nahrávek. Jsou v ní popsány metriky hodnocení kvality audionahrávek, které rozdělujeme do dvou oddělených skupin. První skupinou jsou metriky signálové kvality, druhou metriky obsahové bohatosti. Prvním cílem praktické části je poté vytvořit statistický model pro predikci přesnosti strojového přepisu řečové nahrávky na základě měření její kvality. Druhým cílem je posoudit, které dílčí metriky jsou pro predikci přesnosti strojového přepisu nejdůležitější.
Analýza prosodických a spektrálních vlastností hlasové komunikace v řízení letového provozu
Simonides, Jakub ; Kopřiva, Tomáš (oponent) ; Smékal, Zdeněk (vedoucí práce)
Práca analyzuje prozodické a spektrálne vlastnosti oboch smerov komunikácie riadenia letovej prevádzky, opisuje rozdelenie komunikácie na segmenty v smere od pilota k veži a od veže k pilotovi na základe prepisu. Následne sú jednotlivé segmenty podrobené hĺbkovej analyze ich vlastností. Analyza sa zameriava na spektrum reči v obidvoch smeroch, konkrétne na intenzitu, základnú frekvenciu F0, spektrálnu strmosť a centroid. Naviac ku tomu je vykonaná aj analyza rychlosti reči a detekovania reči. Na základe rozdielnosti tychto parametrov, pre každy smer komunikácie, sú určené faktory, ktoré dopomáhajú k automatickému rozpoznaniu smeru komunikácie.
Identifikace pauz v rušeném řečovém signálu
Kepák, Petr ; Míča, Ivan (oponent) ; Smékal, Zdeněk (vedoucí práce)
Základním problémem řeči je úplné oddělení přirozeného šumu, který vzniká při správné artikulaci znělých a neznělých souhlásek od šumu a rušení okolního prostředí. Cílem diplomové práce je najít efektivní metodu, které by dokázala identifikovat pauzy bez řečové aktivity, v nichž je možné identifikovat vlastnosti šumu a rušení. Jakmile je správně šum určen, pak již je možné využít různých metod pro jeho odstranění. V diplomové práci jsou popsány dvě metody identifikace pauz. Tyto metody jsou naprogramované v prostředí Matlab a testovány na devíti řečových nahrávkách. Analýza výsledků metod byla provedena pomocí ROC (Receiver Operating Characteristic) křivek. V závěru jsou shrnuty výsledky analýzy vytvořených metod.

Národní úložiště šedé literatury : Nalezeno 240 záznamů.   začátekpředchozí21 - 30dalšíkonec  přejít na záznam:
Chcete být upozorněni, pokud se objeví nové záznamy odpovídající tomuto dotazu?
Přihlásit se k odběru RSS.