Národní úložiště šedé literatury Nalezeno 53 záznamů.  začátekpředchozí21 - 30dalšíkonec  přejít na záznam: Hledání trvalo 0.01 vteřin. 
Systém pro diarizaci mluvčích
Bradáč, Josef ; Atassi, Hicham (oponent) ; Míča, Ivan (vedoucí práce)
Systém pro diarizaci mluvčích má široké uplatnění na poli zpracování a analýzy řečových signálů. V této práci je rozebrán úvod do problematiky a následný postup pro navržení systému. Výsledkem práce je implementace samotného systému a jeho vyhodnocení na základě databáze nahrávek rozhovorů.
Určení výšky osob z řečového projevu
Pelikán, Pavel ; Mekyska, Jiří (oponent) ; Atassi, Hicham (vedoucí práce)
Diplomová práce se zaměřuje na určení výšky osob z řečové nahrávky. Nejprve je hodnocen současný stav řešení problému s odkazem na již vytvořené studie a získané poznatky jsou využity k vlastní práci. Byla vybrána studie, která se prezentuje nejlepšími výsledky určení výšky osob. Experimentální část této studie je v rámci diplomové práce rekonstruována. Dále je v rámci experimentální části této práce vytvořen vlastní systém pro odhad výšky řečníka z řečové nahrávky. Úspěšnost systému byla testována s využitím několika příznaků na nahrávkách z databáze TIMIT.
Robustní detekce klíčových slov v řečovém signálu
Vrba, Václav ; Sysel, Petr (oponent) ; Atassi, Hicham (vedoucí práce)
Diplomová práce je rozdělena do dvou částí teoretické a praktické. V teoretické části je zaměřena na metody analýzy a rozpoznání řečových signálů. V praktické části byl vytvořen systém pro rozpoznávání izolovaných slov v prostředí Matlab nezávislý na mluvčím zvlášť pro muže a ženy. Dále byly vytvořeny dvě řečové databáze pro využití v kokpitu a proběhlo testování a evaluace včetně vlivu přidaného šumu.
Detekce Akustického Prostředí z Řeči
Dobrotka, Matúš ; Glembek, Ondřej (oponent) ; Matějka, Pavel (vedoucí práce)
Téma tejto diplomovej práce je klasifikácia audio nahrávky do 15 tried akustických prostredí, v ktorých sa ľudia bežne nachádzajú. Práca popisuje 2 metódy založené na GMM a i-vektoroch a ich vzájomnú fúziu. Na dátach zo súťaže DCASE dosiahol najlepší GMM systém úspešnosť 60.4% a i-vektor systém 68.4%. Fúzia GMM systému a najlepšieho i-vektor systému výsledok ešte zlepšila na 69.3%, čo by v dobe súťaže stačilo na 20. miesto z 98 odovzdaných systémov z celého sveta.
Rozpoznání emočního stavu člověka z řeči
Houdek, Miroslav ; Přinosil, Jiří (oponent) ; Atassi, Hicham (vedoucí práce)
Tato diplomová práce pojednává o rozpoznání emočních stavů a určení pohlaví na základě analýzy řečového signálu. Pro popis řečového signálu jsme využili různých prozodických a kepstrálních příznaků. Součástí práce je popis neinvazivních metod pro odhad hlasivkových pulsů. Pro jednotlivé příznaky řeči jsme vytvořili funkce v programu MATLAB. Klasifikace byla provedena pomocí GMM klasifikátoru, který využívá Gaussova rozložení pravděpodobnosti pro modelování příznakového prostoru. Dále byl sestrojen systém pro rozpoznání emočních stavů mluvčího a systém pro rozpoznání pohlaví mluvčího z řeči. Úspěšnost vytvořených systémů jsme testovali s jednotlivými příznaky na různých délkách segmentů řečového signálu a výsledné procentuální úspěšnosti rozpoznávání porovnali. Závěrem jsme testovali vliv mluvčího a pohlaví na úspěšnost rozpoznání emočních stavů.
Robot s autonomním audio-vizuálním řízením
Dvořáček, Štěpán ; Mašek, Jan (oponent) ; Přinosil, Jiří (vedoucí práce)
Tato práce se zabývá návrhem a realizací mobilního robota s autonomním audiovizuálním řízením. Tento robot je schopen pohybu na základě senzorů složených z kamery a mikrofonu. Konstrukce se skládá z komponent vyrobených 3D tiskem a všesměrových kol Mecanum. Software využívá knihovnu OpenCV pro zpracování obrazu a algoritmy pro výpočet MFCC a DTW pro rozpoznávání hlasových pokynů.
Tool for Automatic Subtitle Alignment
Chudý, Daniel ; Chlubna, Tomáš (oponent) ; Milet, Tomáš (vedoucí práce)
The main motivation of this work is to simplify the retiming of subtitles, where the inputs are the original and edited video files and subtitles corresponding to the original video. Example – a video editor needs to cut a scene from a video. Subtitles that correspond with the clipped part of the video must be manually removed and the subtitle part that follows the clipped part must be manually re-timed. The tool makes this work easier by automating it. From an arbitrarily edited version of the video file (cuts), the original file and the original subtitles, a version of subtitles will be created that fits the edited version of the video file. Simply put, the goal is to align the original subtitles with the edited video file. The solution is the conversion of video files to audio files (.wav, wavfile), extraction of MFCC (Mel-frequency cepstral coefficients) and subsequent mutual comparison with the Dynamic Time Warping (DTW) algorithm. From the alignment path (DTW output), signal differences (cuts in the video) are detected and subtitles are adjusted based on them. A dataset was created to test the application consisisting of public domain films and own recordings. The created application provides 69 – 90 % subtitle alignment success on a dataset that contains videos of length 1 – 60 minutes.
Systém pro rozpoznání hlasových povelů v reálném čase
Šíbl, Evžen ; Kiac, Martin (oponent) ; Přinosil, Jiří (vedoucí práce)
Bakalářská práce se zabývá tvorbou systému pro rozpoznání hlasových povelů. Klasifikátor tohoto systému byl vytvořený pomocí neuronové sítě. V práci se obeznámíte s historií a problematiku rozpoznání řeči. Byl vytvořený systém, který detekuje v nahrávce úsek obsahující řečový signál, který následně pomocí klasifikátoru rozhodne o jaké slovo z tabulky slov se jedná. Byly vytvořeny 3 modely se stejnou architekturou avšak s různými trénovacími daty. Tyto modely byly následně porovnány mezi sebou. Pro výsledný systém bylo vytvořené jednoduché uživatelské rozhraní.
Vztah emocí a intonačních křivek
Gavlasová, Radka ; Smékal, Zdeněk (oponent) ; Tučková,, Jana (vedoucí práce)
Tato práce se zabývá intonačními křivkami s jejími vztahy pro různé emoce. Kromě teoretického základu, který pojednává o tvorbě řeči, zpracování signálů a psychologického nastínění rozdělení emocí, obsahuje také tvorbu vlastní emotivní databáze realizované s profesionálními herci. Cílem této závěrečné práce je klasifikace signálu na základě emoce, kterou nahrávka má představovat. Těmito emocemi jsou hněv, radost, nuda a smutek. Klasifikace probíhala pomocí umělých neuronových sítí, konkrétně v aplikaci Classification Learner, kterou poskytuje programovací prostředí Matlab. Použité příznaky pro tuto metodu byly variace fundamentální frekvence a MFCC. Výsledky byly následně porovnány a zanalyzovány poslechovým testem. Tento test pomohl určit, zda jsou výsledky relevantní pro tuto problematiku. Maximální úspěšnost trénování sítě dosáhla přibližně 82 %, testování pak 75 %. Poslechové testy potvrdily, že výsledky odpovídají předpokládanému lidskému vnímání. Pro podrobnější a lepší vyhodnocení, by bylo zapotřebí větší a kvalitnější databáze.
Signal Processing For Vocal Recognition Of Sturnus Vulgaris
Lázničková, Jana
This paper describes the issue of sturnus vulgaris detection in the vineyards in order toscare these animals more effectively. The analysis and classification of bird singing is difficultbecause many problems can appear. One of the problems is background noise e.g. sounds of cars,trees, and also the singing of various bird species at once. Another problem is different types of birdsongs. For example, an alarm melody, search for food, and also communication between the birdsduring a flight. This article presents a solution to one of these problems in case when only audiorecordings are available.

Národní úložiště šedé literatury : Nalezeno 53 záznamů.   začátekpředchozí21 - 30dalšíkonec  přejít na záznam:
Chcete být upozorněni, pokud se objeví nové záznamy odpovídající tomuto dotazu?
Přihlásit se k odběru RSS.