Národní úložiště šedé literatury Nalezeno 53 záznamů.  předchozí4 - 13dalšíkonec  přejít na záznam: Hledání trvalo 0.01 vteřin. 
Rozpoznávání řeči pro vybrané jazyky
Schmitt, Jan ; Karafiát, Martin (oponent) ; Janda, Miloš (vedoucí práce)
Tato práce se zabývá rozpoznáváním spojité řeči pro trojici jazyků bulharštinu, chorvatštinu a švédštinu. Zpráva popisuje základy zpracování a rozpoznávání řeči, tvorbu akustických modelů pomocí skrytých Markovových modelů a směsi gaussovských rozložení a použití těchto technik pro rozpoznávání řeči v toolkitu Kaldi. Další součástí práce je postup přípravy dat pro toolkity pro rozpoznávání řeči HTK a Kaldi na základě dat z databáze GlobalPhone. V závěru jsou vytvořené modely otestovány pomocí testovacích dat a porovnány výsledky z jednotlivých modelů.
Rozpoznávání emočních stavů na základě analýzy řečového signálu
Čermák, Jan ; Atassi, Hicham (oponent) ; Smékal, Zdeněk (vedoucí práce)
Obsah této práce je zaměřen na klasifikaci emočních stavů s použitím neuronových sítí a klasifikátoru na bázi směsi Gaussových hustotních funkcí s využitím programu Matlab. Pojednává o problematice zpracování řečového signálu, z něhož byly extrahovány prozodické, spektrální příznaky a MFCC koeficienty. Práce se zabývá určením kvality jednotlivých příznaků a výběrem nejvhodnějších pro správnou klasifikaci emočních stavů. Pro určení emočních stavů byly použity dvě rozdílné metody. První metodou jsou neuronové sítě s různě zvolenými parametry. Druhou metodou klasifikace je použití smíšených Gaussových modelů tzv. GMM. U obou metod byla pro klasifikaci rozdělena databáze emočních promluv na trénovací a testovací skupinu. Při testování byla využita metoda nezávislá na mluvčím. Součástí práce je porovnání jednotlivých analyzovaných postupů, zobrazení a porovnání výsledků. Závěrem práce je návrh nejvhodnějších parametrů a klasifikátoru pro rozpoznání emočního stavu mluvčího.
Detekce ohně a kouře ve videosekvenci
Tomek, Peter ; Štancl, Vít (oponent) ; Švub, Miroslav (vedoucí práce)
Cílem práce je analýza vstupní videosekvence a následné nalezení oblastí, které obsahujících oheň nebo kouř. Daný problém je rozdělen na dvě podúlohy-detekci ohně a detekci kouře. Základem a prvním krokem analýzy je detekce daných oblastí pomocí Gaussova zloženého modelu-Gaussian mixture model. Na jeho natrénovaní je použit algoritmus Expectation- Maximization, nebo skráceně EM. Pro detekci kouře se dále používa technika optického toku. Výsledné oblasti jsou pak upraveny pomocí aplikace různých morfologických metod a analýzou vzájemné polohy detekovaných oblastí. Výstupem algoritmu je opět videosek- vence, ve které jsou zvýrazněny oblasti s pravděpodobnou přítomností ohně nebo kouře.
Segmentace cévního řečiště na snímcích sítnice s využitím statistických metod
Šolc, Radek ; Walek, Petr (oponent) ; Odstrčilík, Jan (vedoucí práce)
Diplomová práce se zabývá problematikou segmentace krevního řečiště ze snímku fundus kamery. Teoretická část pojednává o základních charakteristikách těchto snímku. Jsou zde probrány nynější přístupy k segmentaci krevního řečiště. Cíl praktické části je návrh metody využívající statistického modelu. Postupně je vytvářen model využívající Studentova rozdělení, použitelný pro automatickou segmentaci. Do tohoto modelu byl zapojen nejprve iterační algoritmus E-M a poté model založený na Markovských náhodných polích z důvodu zvýšeni robustnosti celého modelu vůči šumu. Kontrast mezi tenkými cévami a okolím byl zvýšen ve fázi předúpravy obrazu pomocí diskrétní vlnovkové transformace. Výstupní binární obraz vlnkové transformace je použit jako maska pro snížení intenzity odstínu šedi tenkých cév a zesvětlení okolí patřící pozadí sítnice. Celý model byl implementován v prostředí Matlab. Navržený model byl testována na celé databázi snímků HRF. Výstupní binární obrazy byli kvantitativně hodnoceny v porovnání s zlatými standardy HRF.
Neuronové sítě při klasifikaci mluvčích
Svoboda, Libor ; Atassi, Hicham (oponent) ; Míča, Ivan (vedoucí práce)
Obsah této práce je zaměřen na neuronové sítě při klasifikaci mluvčích. Pojednává o problematice zpracování řečového signálu a jsou zde uvedeny i některé typy neuronových sítí. Součástí práce bylo sestavení databáze nahrávek od řečníků různého pohlaví a věku. Z této databáze pak byla sestavena trénovací a testovací skupina. Dále byly navrženy čtyři klasifikátory. Jeden na bázi směsi Gaussových hustotních funkcí a tři neuronové klasifikátory. Tyto systémy byly testovány a analyzovány podle věku, pohlaví a na závěr pro obě tyto kritéria. Současně je věnována pozornost i volbě vhodných příznaků v každé této úloze klasifikace. Na konci práce jsou uvedeny výsledky analýz pro jednotlivé skupiny i příznaky. Z těchto výsledků jsou stanoveny nejvhodnější příznaky, pro danou úlohu klasifikace a také nejúspěšnější klasifikátory.
Konverze hlasu
Brukner, Jan ; Plchot, Oldřich (oponent) ; Černocký, Jan (vedoucí práce)
Práce se věnuje konverzi hlasu. Tedy metodě, ve které se snažíme modifikovat řečové parametry zdrojového mluvčího na cílového. V práci je nejdříve popsána Voice Conversion Challenge (VCC), ve které se účastníci snažili vytvořit co nejlepší systém pro konverzi hlasu. V další části jsou analyzovány komponenty baseline systému použitého ve VCC. Poté jsou navrženy úpravy, které mohou zlepšit kvalitu konvertovaného hlasu. Následně je stručně popsána implementace těchto úprav a vyhodnoceny výsledky změn. V závěru je část věnována dalším možnostem vylepšení konverze hlasu.
Klasifikace akustických signálů
Pospíšil, Aleš ; Balík, Miroslav (oponent) ; Atassi, Hicham (vedoucí práce)
Bakalářská práce se zaměřuje na problematiku automatické klasifikace hudebních žánrů. Nejprve je hodnocen současný stav řešení problému s odkazem na již vytvořené studie a získané poznatky jsou využity k vlastní práci. Předmětem řešení problému je shrnutí použitelných hudebních příznaků a také klasifikačních metod jako neuronové sítě a k-nejbližší soused. Vybrané klasifikační třídy jsou vážná hudba, elektro, jazz a rock. Výsledkem bakalářské práce je systém pro automatické rozpoznání hudebních žánrů, který bude použitelný a uživatelsky přístupný. Dosažené rozpoznavací výsledky do jisté míry respektují schopnosti lidského organismu právě hudební žánry rozpoznat.
Textově závislé rozpoznávání mluvčího
Fux, Jan ; Glembek, Ondřej (oponent) ; Matějka, Pavel (vedoucí práce)
Cílem této bakalářské práce bylo navrhnout systém pro textově závislé rozpoznávání mluvčího. Bylo otestováno několik přístupů na databázi MIT, která obsahuje nahrávky průměrné délky 0,46s. Z otestovaných přístupů se jeví jako nejlepší kombinace systému DTW s využitím odhadu posteriorních pravděpodobností fonémů (posteriogramu) jako výstupu z Fonémového rozpoznávače, a akustického SID systému založeného na iVektorech a PLDA (Probabilistic Linear Component Analysis). Fúze těchto dvou systémů pomocí Neuronové sítě dosahuje nejlepších výsledků (EER) a to 17,84% pro ženy a 16,38% pro muže, což je relativní zlepšení 49,9% u žen a 54,2% u mužů oproti samostatnému akustickému rozpoznávání.
Rozpoznávání emoční stavů na základě řečového záznamu
Lněnička, Jakub ; Míča, Ivan (oponent) ; Smékal, Zdeněk (vedoucí práce)
Cílem diplomového projektu je nalézt metodu, jejímž prostřednictvím bude možné provést klasifikaci vybraných emocí z promluvy. V úvodu se práce zabývá popisem částí lidského těla vytvářejících hlas a jejich fungováním. Dále se text věnuje problematice zpracování lidského hlasu do digitální formy. Velká pozornost je věnována parametrům řečového signálu s důrazem na popis příznaků sloužících k určení vybraných emocí. Práce se zabývá rozpoznáním emocí a popisem některých z nich. Hlavní část práce spočívá v hledání optimální metody pro redukci segmentálních a suprasegmentálních příznaků řečové promluvy. Výsledků práce bylo dosaženo porovnáním úspěšnosti klasifikace vybraných emocí při použití více metod a porovnání jejich výsledků. Nejdůležitějším kritériem při posuzování výsledků byla redukce parametrů řečového signálu, vycházející z dosavadního výzkumu v dané oblasti.
Multiplatformní aplikace pro verifikaci mluvčího
Görig, Jan ; Matějka, Pavel (oponent) ; Glembek, Ondřej (vedoucí práce)
Bakalářská práce se zabývá rozpoznáváním mluvčího bez znalosti textu sdělení. Zmiňuje dnes používané způsoby extrakce příznaků a jejich vyhodnocení pomocí směsice Gaussových hustotních funkcí. Praktickým výstupem práce je aplikace pro vizualizaci průběhu rozpoznávání. Návrh aplikace je multiplatformní a využívá knihoven Qt a BSAPI.

Národní úložiště šedé literatury : Nalezeno 53 záznamů.   předchozí4 - 13dalšíkonec  přejít na záznam:
Chcete být upozorněni, pokud se objeví nové záznamy odpovídající tomuto dotazu?
Přihlásit se k odběru RSS.