Národní úložiště šedé literatury Nalezeno 53 záznamů.  začátekpředchozí41 - 50další  přejít na záznam: Hledání trvalo 0.01 vteřin. 
Rozpoznávání pozic a gest
Jiřík, Leoš ; Hradiš, Michal (oponent) ; Zemčík, Pavel (vedoucí práce)
Práce se zabývá studiem současného stavu v problematice zpracování obrazu, zvláště s ohledem k rozpoznávání gest. Zmiňuje vybrané postupy jiných autorů a podrobuje je kritickému pohledu. V druhé části se věnuje návrhu algoritmu, který by umožnil spolehlivé rozpoznávání gest v datech z projektů AMI a M4. Navrhují se prostředky zpřesnění informace o poloze účastníků a zpracování dynamických dat za účelem jejich přípravy k rozpoznávání. Je navržena možnost rozpoznávání gest pomocí směsi Gaussových funkcí a analýzy periodičnosti. Zkoumaná třída gest jsou gesta podporující řeč účastníka záznamu. Poslední část demonstruje výsledky a diskutuje další možný postup.
Multiplatformní aplikace pro verifikaci mluvčího
Görig, Jan ; Matějka, Pavel (oponent) ; Glembek, Ondřej (vedoucí práce)
Bakalářská práce se zabývá rozpoznáváním mluvčího bez znalosti textu sdělení. Zmiňuje dnes používané způsoby extrakce příznaků a jejich vyhodnocení pomocí směsice Gaussových hustotních funkcí. Praktickým výstupem práce je aplikace pro vizualizaci průběhu rozpoznávání. Návrh aplikace je multiplatformní a využívá knihoven Qt a BSAPI.
Rozpoznávání řeči pro vybrané jazyky
Schmitt, Jan ; Karafiát, Martin (oponent) ; Janda, Miloš (vedoucí práce)
Tato práce se zabývá rozpoznáváním spojité řeči pro trojici jazyků bulharštinu, chorvatštinu a švédštinu. Zpráva popisuje základy zpracování a rozpoznávání řeči, tvorbu akustických modelů pomocí skrytých Markovových modelů a směsi gaussovských rozložení a použití těchto technik pro rozpoznávání řeči v toolkitu Kaldi. Další součástí práce je postup přípravy dat pro toolkity pro rozpoznávání řeči HTK a Kaldi na základě dat z databáze GlobalPhone. V závěru jsou vytvořené modely otestovány pomocí testovacích dat a porovnány výsledky z jednotlivých modelů.
Klasifikace akustických signálů
Pospíšil, Aleš ; Balík, Miroslav (oponent) ; Atassi, Hicham (vedoucí práce)
Bakalářská práce se zaměřuje na problematiku automatické klasifikace hudebních žánrů. Nejprve je hodnocen současný stav řešení problému s odkazem na již vytvořené studie a získané poznatky jsou využity k vlastní práci. Předmětem řešení problému je shrnutí použitelných hudebních příznaků a také klasifikačních metod jako neuronové sítě a k-nejbližší soused. Vybrané klasifikační třídy jsou vážná hudba, elektro, jazz a rock. Výsledkem bakalářské práce je systém pro automatické rozpoznání hudebních žánrů, který bude použitelný a uživatelsky přístupný. Dosažené rozpoznavací výsledky do jisté míry respektují schopnosti lidského organismu právě hudební žánry rozpoznat.
Segmentace cévního řečiště na snímcích sítnice s využitím statistických metod
Šolc, Radek ; Walek, Petr (oponent) ; Odstrčilík, Jan (vedoucí práce)
Diplomová práce se zabývá problematikou segmentace krevního řečiště ze snímku fundus kamery. Teoretická část pojednává o základních charakteristikách těchto snímku. Jsou zde probrány nynější přístupy k segmentaci krevního řečiště. Cíl praktické části je návrh metody využívající statistického modelu. Postupně je vytvářen model využívající Studentova rozdělení, použitelný pro automatickou segmentaci. Do tohoto modelu byl zapojen nejprve iterační algoritmus E-M a poté model založený na Markovských náhodných polích z důvodu zvýšeni robustnosti celého modelu vůči šumu. Kontrast mezi tenkými cévami a okolím byl zvýšen ve fázi předúpravy obrazu pomocí diskrétní vlnovkové transformace. Výstupní binární obraz vlnkové transformace je použit jako maska pro snížení intenzity odstínu šedi tenkých cév a zesvětlení okolí patřící pozadí sítnice. Celý model byl implementován v prostředí Matlab. Navržený model byl testována na celé databázi snímků HRF. Výstupní binární obrazy byli kvantitativně hodnoceny v porovnání s zlatými standardy HRF.
Rozpoznávání emoční stavů na základě řečového záznamu
Lněnička, Jakub ; Míča, Ivan (oponent) ; Smékal, Zdeněk (vedoucí práce)
Cílem diplomového projektu je nalézt metodu, jejímž prostřednictvím bude možné provést klasifikaci vybraných emocí z promluvy. V úvodu se práce zabývá popisem částí lidského těla vytvářejících hlas a jejich fungováním. Dále se text věnuje problematice zpracování lidského hlasu do digitální formy. Velká pozornost je věnována parametrům řečového signálu s důrazem na popis příznaků sloužících k určení vybraných emocí. Práce se zabývá rozpoznáním emocí a popisem některých z nich. Hlavní část práce spočívá v hledání optimální metody pro redukci segmentálních a suprasegmentálních příznaků řečové promluvy. Výsledků práce bylo dosaženo porovnáním úspěšnosti klasifikace vybraných emocí při použití více metod a porovnání jejich výsledků. Nejdůležitějším kritériem při posuzování výsledků byla redukce parametrů řečového signálu, vycházející z dosavadního výzkumu v dané oblasti.
Rozpoznání paralingvistických signálů v řečovém projevu
Mašek, Jan ; Míča, Ivan (oponent) ; Atassi, Hicham (vedoucí práce)
Tento dokument popisuje tři metody pro klasifikaci paralingvistických výrazů jako smích a pláč z každodenních rozhovorů analýzou zvukového signálu. Pro tento účel byla vytvořena databáze nahrávek. Protože se dnes často setkáváme i s hudbou, byly do databáze začleněny i stavy: řeč, hudba, hudba se zpěvem a řeč s hudbou v pozadí. Extrakce příznaků, redukce příznaků a klasifikace jsou společné kroky v rozpoznání pro všechny tři popsané metody. Rozdíl metod spočívá v samotné klasifikaci. První metoda využívá přímého přístupu a klasifikuje všechny třídy najednou. Druhá metoda využívá postupnou klasifikaci ve stromové struktuře, která se skládá z pěti dílčích klasifikátorů. Poslední metoda využívá klasifikaci každé z dvojic tříd samostatně. Nejlepší příznaky pro každou z dílčích klasifikací byly identifikovány využitím statistické metody F-poměru a pro každou klasifikaci byly použity Gaussovy smíšené modely.
Rozpoznávání emočních stavů na základě analýzy řečového signálu
Čermák, Jan ; Atassi, Hicham (oponent) ; Smékal, Zdeněk (vedoucí práce)
Obsah této práce je zaměřen na klasifikaci emočních stavů s použitím neuronových sítí a klasifikátoru na bázi směsi Gaussových hustotních funkcí s využitím programu Matlab. Pojednává o problematice zpracování řečového signálu, z něhož byly extrahovány prozodické, spektrální příznaky a MFCC koeficienty. Práce se zabývá určením kvality jednotlivých příznaků a výběrem nejvhodnějších pro správnou klasifikaci emočních stavů. Pro určení emočních stavů byly použity dvě rozdílné metody. První metodou jsou neuronové sítě s různě zvolenými parametry. Druhou metodou klasifikace je použití smíšených Gaussových modelů tzv. GMM. U obou metod byla pro klasifikaci rozdělena databáze emočních promluv na trénovací a testovací skupinu. Při testování byla využita metoda nezávislá na mluvčím. Součástí práce je porovnání jednotlivých analyzovaných postupů, zobrazení a porovnání výsledků. Závěrem práce je návrh nejvhodnějších parametrů a klasifikátoru pro rozpoznání emočního stavu mluvčího.
Rozpoznání emočního stavu člověka z řeči
Houdek, Miroslav ; Přinosil, Jiří (oponent) ; Atassi, Hicham (vedoucí práce)
Tato diplomová práce pojednává o rozpoznání emočních stavů a určení pohlaví na základě analýzy řečového signálu. Pro popis řečového signálu jsme využili různých prozodických a kepstrálních příznaků. Součástí práce je popis neinvazivních metod pro odhad hlasivkových pulsů. Pro jednotlivé příznaky řeči jsme vytvořili funkce v programu MATLAB. Klasifikace byla provedena pomocí GMM klasifikátoru, který využívá Gaussova rozložení pravděpodobnosti pro modelování příznakového prostoru. Dále byl sestrojen systém pro rozpoznání emočních stavů mluvčího a systém pro rozpoznání pohlaví mluvčího z řeči. Úspěšnost vytvořených systémů jsme testovali s jednotlivými příznaky na různých délkách segmentů řečového signálu a výsledné procentuální úspěšnosti rozpoznávání porovnali. Závěrem jsme testovali vliv mluvčího a pohlaví na úspěšnost rozpoznání emočních stavů.
Neuronové sítě při klasifikaci mluvčích
Svoboda, Libor ; Atassi, Hicham (oponent) ; Míča, Ivan (vedoucí práce)
Obsah této práce je zaměřen na neuronové sítě při klasifikaci mluvčích. Pojednává o problematice zpracování řečového signálu a jsou zde uvedeny i některé typy neuronových sítí. Součástí práce bylo sestavení databáze nahrávek od řečníků různého pohlaví a věku. Z této databáze pak byla sestavena trénovací a testovací skupina. Dále byly navrženy čtyři klasifikátory. Jeden na bázi směsi Gaussových hustotních funkcí a tři neuronové klasifikátory. Tyto systémy byly testovány a analyzovány podle věku, pohlaví a na závěr pro obě tyto kritéria. Současně je věnována pozornost i volbě vhodných příznaků v každé této úloze klasifikace. Na konci práce jsou uvedeny výsledky analýz pro jednotlivé skupiny i příznaky. Z těchto výsledků jsou stanoveny nejvhodnější příznaky, pro danou úlohu klasifikace a také nejúspěšnější klasifikátory.

Národní úložiště šedé literatury : Nalezeno 53 záznamů.   začátekpředchozí41 - 50další  přejít na záznam:
Chcete být upozorněni, pokud se objeví nové záznamy odpovídající tomuto dotazu?
Přihlásit se k odběru RSS.