Národní úložiště šedé literatury Nalezeno 67 záznamů.  začátekpředchozí21 - 30dalšíkonec  přejít na záznam: Hledání trvalo 0.01 vteřin. 
Deep learning based sound event recognition
Bajzík, Jakub ; Kiska, Tomáš (oponent) ; Přinosil, Jiří (vedoucí práce)
This paper deals with processing and recognition of events in audio signal. The work explores the possibility of using audio signal visualization and subsequent use of convolutional neural networks as a classifier for recognition in real use. Recognized audio events are gunshots placed in a sound background such as street noise, human voice, animal sounds, and other forms of random noise. Before the implementation, a large database with various parameters, especially reverberation and time positioning within the processed section, is created. In this work are used freely available platforms Keras and TensorFlow for work with neural networks.
De-identifikace řečníků postižených hypokinetickou dysartrií
Kárník, Radoslav ; Kiska, Tomáš (oponent) ; Mekyska, Jiří (vedoucí práce)
Tato práce se zabývá návrhem a realizací systému, který provádí de-identifikace řečových nahrávek pacientů postižených Parkinsonovou nemocí. V práci jsou popsány příčiny a projevy Parkinsonovy nemoci a vlivy hypokinetické dysartrie na řečový projev pacientů. Část práce je věnována řečovým příznakům popisujícím prozodii, podle pomocí kterých se dá hypokinetická dysartrie diagnostikovat z řeči. Dále se zabývá způsoby de-identifikace řeči a systémem na evaluaci výsledků pomocí rozeznávání řečníků a pacientů. De-identifikační systém využívá Normalizaci vokálního traktu (VTLN), evaluační systém využívá Gaussovy smíšené modely (GMM). Na testování byla využita databáze PARCZ, která obsahuje nahrávky řečových cvičení pacientů postižených Parkinsonovou nemocí a kontrolních řečníků.
Rozpoznávání hudebních coververzí pomocí technik Music Information Retrieval
Martinek, Václav ; Zvončák, Vojtěch (oponent) ; Kiska, Tomáš (vedoucí práce)
Tato diplomová práce se zabyvá návrhem a realizací systému rozpoznávajícího hudební coververze. Úvodní část je věnována vypočtu parametrů z audio signálu pomocí technik Music Information Retrieval. Následně jsou definovány různé podoby coververzí a hudební aspekty, které coververze sdílí. V práci je rovněž podrobně popsána tvorba a rozdělení databáze coververzí. Dále jsou zde uvedeny metody a techniky pro porovnání a zpracování vypočítanych parametrů. Pozornost je pak věnována metodě OTI, vypočet CSM a metodám, které se zabyvají selekcí parametrů. Další část se věnuje návrhu systémů na rozpoznávání coververzí. V práci jsou pak srovnány již navržené systémy na rozpoznávání coververzí. Následně jsou popsány techniky strojového učení a evaluační metody pro vyhodnocení klasifikace. Větší část je věnována umělym neuronovym sítím. Poslední kapitola se zabyvá implementací dvou systémů v prostředí MATLAB a Python. Tyto systémy jsou následně otestovány na vytvořené databázi coververzí. V závěru je diskutována úspěšnost těchto systémů a případné možnosti pro zlepšení.
Rozpoznávání hudební nálady a emocí za pomoci technik Music Information Retrieval
Smělý, Pavel ; Mucha, Ján (oponent) ; Kiska, Tomáš (vedoucí práce)
Tato práce se zabývá oblastí Music Information Retrieval, přesněji její podoblastí zaměřující se na rozpoznávání hudebních emocí s názvem Music Emotion Recognition. Počáteční kapitoly práce se věnují obecnému přehledu a definici MER, kategorizaci jednotlivých metod a nabízejí tak komplexní pohled na tuto vědní disciplínu. Práce se dále zabývá výběrem a popisem vhodných parametrů pro rozpoznávání emocí, k čemuž využívá nástroje openSMILE a MIRtoolbox. K získání databáze nahrávek a jejich subjektivních emočních popisů byla použita volně dostupná databáze DEAM. Praktická část práce se již plně zabývá návrhem statického dimenzionálního regresního vyhodnocovacího systému pro číselnou predikci hudebních emocí u hudebních nahrávek, přesněji jejich polohy v AV emočním prostoru. Práce publikuje a komentuje přehled dosažených výsledků jak pro individuální analýzu významnosti jednotlivých parametrů pro úspěšnost predikce, tak celkové analýzy úspěšnosti predikce navrženého modelu.
Rekonstrukce signálu modifikovaného efektem fade-in/fade-out
Bača, Petr ; Kiska, Tomáš (oponent) ; Rajmic, Pavel (vedoucí práce)
Bakalářská práce nese teoretický podklad pro zpracování speciální úlohy dekvantizace, a to rekonstrukce signálu postiženého efektem fade-in, fade-out. Je zde obsažen teoretický úvod shrnující základní poznatky o převodu z analogové oblasti do digitální. Dále zde nalézáme objasnění fenoménu řídkých reprezentací signálů, je zde formulována dekvantizační úloha a nadnesen algoritmus k jejímu výpočtu. Práce popisuje realizaci úlohy a přináší shrnutí výsledků celého procesu.
Rozpoznávání hudebního žánru za pomoci technik Music Information Retrieval
Zemánková, Šárka ; Zvončák, Vojtěch (oponent) ; Kiska, Tomáš (vedoucí práce)
Tato diplomová práce se zabývá rozpoznáváním hudebního žánru za pomoci technik Music Information Retrieval. Je zde stručně popsána podstata této oblasti výzkumu i její podobor zvaný Music Genre Recognition. Následující kapitola obsahuje výběr nejvhodnějších parametrů pro určení hudebního žánru. Dále jsou v této práci popsány metody strojového učení, využívané v této oblasti. Další kapitola se věnuje popisu databází nahrávek vytvořených pro výzkumy žánrové klasifikace. Následuje návrh a implementace vyhodnocovacího systému pro rozpoznávání hudebního žánru. V poslední části práce jsou popsány výsledky analýzy dílčích parametrů, závislost přesnosti žánrové klasifikace na množství využitých parametrů a diskutovány příčiny úspěšnosti zařazení jednotlivých žánrů.
Platforma pro subjektivní hodnocení video sekvencí
Srnec, Tomáš ; Kiska, Tomáš (oponent) ; Číka, Petr (vedoucí práce)
Tato bakalářská práce se zabývá subjektivním hodnocením kvality videosekvencí. V první kapitole jsou obecně popsány použité moderní kodeky H.264, H.265, VP8 a VP9. V další části se rozebírají čtyři metody pro subjektivní hodnocení videosekvencí dle normy ITU-T P.910. Praktická část obsahuje kódování tří vybraných videí, do čtyř kodeků, pro čtyři rozlišení. Výstupem je JavaFX aplikace, ve které účastníci testování zhlédli a ohodnotili připravená videa. Jejich hodnocení se v reálném čase odesílalo na MYSQL server a přímo v aplikaci se vyhodnotilo do přehledných graů. Po zhodnocení výsledků byl určen jako nejlepší kodek VP9 před kodeky H.265, H.264 a VP8.
Alternativní JPEG kodér/dekodér
Jirák, Jakub ; Kiska, Tomáš (oponent) ; Rajmic, Pavel (vedoucí práce)
Kodek JPEG je v současné době nejrozšířenější obrázkový formát. Tato práce se zabývá navrhnutím a implementací alternativního JPEG kodeku využívajícího proximální algoritmy v kombinaci se zafixováním bodů z původního obrazu k potlačení artefaktů vznikajících v běžném JPEG kodéru. V rámci řešení daného problému byla nejprve využita prox_TV a následně Douglas-Rachford algoritmus, pro který byla odvozena speciální funkce využívající l_1-normu k rekonstrukci obrazu. Výsledky navrhnutého řešení jsou velmi dobré, jelikož dokáže efektivně potlačit vzniklé artefakty a zároveň výsledek odpovídá obrazu s vyšším nastaveným kvalitativním faktorem. Navrhnutá metoda dosahuje velmi dobrých výsledků jak pro jednoduché obrázky tak pro fotografie, avšak v případě velkých obrázků (1024x1024 px) a větších je zapotřebí velkého množství výpočetního času, proto je metoda vhodná spíše pro menší obrázky.
Výzkum dynamických parametrů porovnávající zvukové nahrávky
Zemánková, Šárka ; Smékal, Zdeněk (oponent) ; Kiska, Tomáš (vedoucí práce)
Tato práce se zabývá analýzou parametrů, souvisejících s dynamikou zvukové nahrávky. Je zde stručně popsána historie zpracování nahrávek v analogové a digitální podobě i průběh zpracování zvukového signálu v současnosti. Následující kapitola obsahuje výběr nejvhodnějších parametrů pro popis zvukové nahrávky, především těch, které popisují dynamiku. Tato práce dále charakterizuje metody, využívané při podobných výzkumech ve světě. Také je zde navržen systém pro výpočet 43 dynamických parametrů a nastíněny možnosti jejich analýzy. Porovnáváno bylo 35 různých interpretací jednoho hudebního díla. Nakonec došlo k zaznamenání vypočítaných parametrů do bodových diagramů a k jejich vyhodnocení pomocí vizuální shlukové analýzy.
Acoustic analysis of gender-related patterns in Parkinson's disease
Herinek, Denis ; Kiska, Tomáš (oponent) ; Galáž, Zoltán (vedoucí práce)
The bachelor's thesis is about acoustic analysis of gender-related patterns in Parkinson's disease by analysing speech task: reading passage. Parkinson's disease manifests in all subsystems involved in speech production (respiration, phonation, articulation and prosody). The aim of this thesis is familirization with symptoms of this disorder and speech parameters influenced by this disorder. Thesis contains preprocessing, parametrization of speech signal and statistic analysis of parameters. System of speech signal processing is created in MATLAB programming language.

Národní úložiště šedé literatury : Nalezeno 67 záznamů.   začátekpředchozí21 - 30dalšíkonec  přejít na záznam:
Chcete být upozorněni, pokud se objeví nové záznamy odpovídající tomuto dotazu?
Přihlásit se k odběru RSS.