Národní úložiště šedé literatury Nalezeno 67 záznamů.  začátekpředchozí25 - 34dalšíkonec  přejít na záznam: Hledání trvalo 0.01 vteřin. 
Rekonstrukce signálu modifikovaného efektem fade-in/fade-out
Bača, Petr ; Kiska, Tomáš (oponent) ; Rajmic, Pavel (vedoucí práce)
Bakalářská práce nese teoretický podklad pro zpracování speciální úlohy dekvantizace, a to rekonstrukce signálu postiženého efektem fade-in, fade-out. Je zde obsažen teoretický úvod shrnující základní poznatky o převodu z analogové oblasti do digitální. Dále zde nalézáme objasnění fenoménu řídkých reprezentací signálů, je zde formulována dekvantizační úloha a nadnesen algoritmus k jejímu výpočtu. Práce popisuje realizaci úlohy a přináší shrnutí výsledků celého procesu.
Rozpoznávání hudebního žánru za pomoci technik Music Information Retrieval
Zemánková, Šárka ; Zvončák, Vojtěch (oponent) ; Kiska, Tomáš (vedoucí práce)
Tato diplomová práce se zabývá rozpoznáváním hudebního žánru za pomoci technik Music Information Retrieval. Je zde stručně popsána podstata této oblasti výzkumu i její podobor zvaný Music Genre Recognition. Následující kapitola obsahuje výběr nejvhodnějších parametrů pro určení hudebního žánru. Dále jsou v této práci popsány metody strojového učení, využívané v této oblasti. Další kapitola se věnuje popisu databází nahrávek vytvořených pro výzkumy žánrové klasifikace. Následuje návrh a implementace vyhodnocovacího systému pro rozpoznávání hudebního žánru. V poslední části práce jsou popsány výsledky analýzy dílčích parametrů, závislost přesnosti žánrové klasifikace na množství využitých parametrů a diskutovány příčiny úspěšnosti zařazení jednotlivých žánrů.
Platforma pro subjektivní hodnocení video sekvencí
Srnec, Tomáš ; Kiska, Tomáš (oponent) ; Číka, Petr (vedoucí práce)
Tato bakalářská práce se zabývá subjektivním hodnocením kvality videosekvencí. V první kapitole jsou obecně popsány použité moderní kodeky H.264, H.265, VP8 a VP9. V další části se rozebírají čtyři metody pro subjektivní hodnocení videosekvencí dle normy ITU-T P.910. Praktická část obsahuje kódování tří vybraných videí, do čtyř kodeků, pro čtyři rozlišení. Výstupem je JavaFX aplikace, ve které účastníci testování zhlédli a ohodnotili připravená videa. Jejich hodnocení se v reálném čase odesílalo na MYSQL server a přímo v aplikaci se vyhodnotilo do přehledných graů. Po zhodnocení výsledků byl určen jako nejlepší kodek VP9 před kodeky H.265, H.264 a VP8.
Alternativní JPEG kodér/dekodér
Jirák, Jakub ; Kiska, Tomáš (oponent) ; Rajmic, Pavel (vedoucí práce)
Kodek JPEG je v současné době nejrozšířenější obrázkový formát. Tato práce se zabývá navrhnutím a implementací alternativního JPEG kodeku využívajícího proximální algoritmy v kombinaci se zafixováním bodů z původního obrazu k potlačení artefaktů vznikajících v běžném JPEG kodéru. V rámci řešení daného problému byla nejprve využita prox_TV a následně Douglas-Rachford algoritmus, pro který byla odvozena speciální funkce využívající l_1-normu k rekonstrukci obrazu. Výsledky navrhnutého řešení jsou velmi dobré, jelikož dokáže efektivně potlačit vzniklé artefakty a zároveň výsledek odpovídá obrazu s vyšším nastaveným kvalitativním faktorem. Navrhnutá metoda dosahuje velmi dobrých výsledků jak pro jednoduché obrázky tak pro fotografie, avšak v případě velkých obrázků (1024x1024 px) a větších je zapotřebí velkého množství výpočetního času, proto je metoda vhodná spíše pro menší obrázky.
Výzkum dynamických parametrů porovnávající zvukové nahrávky
Zemánková, Šárka ; Smékal, Zdeněk (oponent) ; Kiska, Tomáš (vedoucí práce)
Tato práce se zabývá analýzou parametrů, souvisejících s dynamikou zvukové nahrávky. Je zde stručně popsána historie zpracování nahrávek v analogové a digitální podobě i průběh zpracování zvukového signálu v současnosti. Následující kapitola obsahuje výběr nejvhodnějších parametrů pro popis zvukové nahrávky, především těch, které popisují dynamiku. Tato práce dále charakterizuje metody, využívané při podobných výzkumech ve světě. Také je zde navržen systém pro výpočet 43 dynamických parametrů a nastíněny možnosti jejich analýzy. Porovnáváno bylo 35 různých interpretací jednoho hudebního díla. Nakonec došlo k zaznamenání vypočítaných parametrů do bodových diagramů a k jejich vyhodnocení pomocí vizuální shlukové analýzy.
Acoustic analysis of gender-related patterns in Parkinson's disease
Herinek, Denis ; Kiska, Tomáš (oponent) ; Galáž, Zoltán (vedoucí práce)
The bachelor's thesis is about acoustic analysis of gender-related patterns in Parkinson's disease by analysing speech task: reading passage. Parkinson's disease manifests in all subsystems involved in speech production (respiration, phonation, articulation and prosody). The aim of this thesis is familirization with symptoms of this disorder and speech parameters influenced by this disorder. Thesis contains preprocessing, parametrization of speech signal and statistic analysis of parameters. System of speech signal processing is created in MATLAB programming language.
Určování období vzniku interpretace za pomoci metod parametrizace hudebního signálu
Král, Vítězslav ; Mucha, Ján (oponent) ; Kiska, Tomáš (vedoucí práce)
Cílem této diplomové práce je shrnout dosavadní poznatky z oblasti srovnávání zvukových nahrávek a implementovat vyhodnocovací systém pro určení období vzniku za pomoci metod parametrizace hudebního signálu. V první části této práce jsou popsány reprezentace, jakých hudba může nabývat. Dále je uveden průřez parametrů, které mohou být z hudebních nahrávek extrahovány a poskytují informaci o dynamice, tempu, barvě či časovém vývoji hudební nahrávky. V části druhé je popsán vyhodnocovací systém a jeho jednotlivé dílčí bloky. Vstupními daty pro tento vyhodnocovací systém je vytvořená databáze, čítající 56 zvukových nahrávek první věty Beethovenovy páté symfonie. Poslední kapitola je věnována shrnutí dosažených výsledků.
Rozpoznávání hudebních nástrojů ze zvukových nahrávek za pomoci technik Music Information Retrieval
Kárník, Radoslav ; Mucha, Ján (oponent) ; Kiska, Tomáš (vedoucí práce)
Tato práce se zabývá návrhem a realizací klasifikačního systému pro rozpoznání hudebních nástrojů z hudebních nahrávek s využitím metod Music Information Retrieval. V první části práce jsou popsány jednotlivé parametry vhodné k rozpoznávání nástrojů, jejich výpočet z nahrávek a následná redukce příznakového vektoru. Další části jsou věnovány výběru, ladění a implementaci klasifikátorů v prostředí Python se zaměřením na neuronové sítě. Tyto klasifikátory jsou dále testovány na nahrávkách z databáze IRMAS, které obsahují 11 různých hudebních nástrojů hrající sólo anebo s dalšími nástroji. V poslední části jsou porovnány výsledky klasifikátorů při použití různých parametrů a různého počtu nástrojů.
Automatické tagování hudebních děl pomocí metod strojového učení
Semela, René ; Galáž, Zoltán (oponent) ; Kiska, Tomáš (vedoucí práce)
Systémy pro automatické tagování hudebních děl jsou jednou z mnoha výzev pro obor strojového učení, a to zejména z hlediska komplexnosti celé této problematiky. Praktické uplatnění mohou tyto systémy nalézat zejména v obsahové analýze hudebních děl nebo při třídění obsahu hudebních knihoven. Tato práce se zabývá návrhem, trénováním, testováním a evaluací architektur umělých neuronových sítí pro automatické tagování hudebních děl. V úvodu je pozornost věnována položení ucelených teoretických základů pro tuto problematiku. V praktické části je pak navrženo 8 architektur neuronových sítí (4 plně konvoluční a 4 konvolučně-rekurentní). Tyto architektury jsou následně natrénovány za pomoci MagnaTagATune Dataset a mel spektrogramu a následně je provedeno jejich testování a evaluace. Nejlepších výsledků zde dosahuje čtyřvrstvá konvolučně-rekurentní neuronová síť (CRNN4) s hodnotou ROC-AUC = 0,9046 ± 0,0016. Jako další krok praktické části je vytvořen kompletně nový Last.fm Dataset 2020, který je sestaven díky napojení na API služeb Last.fm a Spotify. Tento nový dataset čítá 100 tagů a 122877 skladeb. Nejúspěšnější architektury jsou na tomto novém datasetu natrénovány, otestovány a evaluovány, a je tak položena základní hranice hodnot ROC-AUC, kterých lze za pomoci tohoto datasetu dosáhnout. Nejlepších výsledků zde dosahuje šestivrstvá plně konvoluční neuronová síť (FCNN6) s hodnotou ROC-AUC = 0,8590 ± 0,0011. Na závěr celé práce je vytvořena jednoduchá aplikace pro otestování jednotlivých architektur neuronových sítí na uživatelem vloženém zvukovém souboru. Práce se svými výsledky vyrovnává světovým pracím na stejné téma a přináší několik nových poznatků a inovací. Z hlediska inovací je zejména dosaženo podstatného snížení komplexnosti jednotlivých architektur neuronových sítí v porovnání se světovými pracemi při zachování podobných výsledků.
Rozpoznávání hudebních coververzí pomocí technik Music Information Retrieval
Martinek, Václav ; Zvončák, Vojtěch (oponent) ; Kiska, Tomáš (vedoucí práce)
Tato diplomová práce se zabyvá návrhem a realizací systému rozpoznávajícího hudební coververze. Úvodní část je věnována vypočtu parametrů z audio signálu pomocí technik Music Information Retrieval. Následně jsou definovány různé podoby coververzí a hudební aspekty, které coververze sdílí. V práci je rovněž podrobně popsána tvorba a rozdělení databáze coververzí. Dále jsou zde uvedeny metody a techniky pro porovnání a zpracování vypočítanych parametrů. Pozornost je pak věnována metodě OTI, vypočet CSM a metodám, které se zabyvají selekcí parametrů. Další část se věnuje návrhu systémů na rozpoznávání coververzí. V práci jsou pak srovnány již navržené systémy na rozpoznávání coververzí. Následně jsou popsány techniky strojového učení a evaluační metody pro vyhodnocení klasifikace. Větší část je věnována umělym neuronovym sítím. Poslední kapitola se zabyvá implementací dvou systémů v prostředí MATLAB a Python. Tyto systémy jsou následně otestovány na vytvořené databázi coververzí. V závěru je diskutována úspěšnost těchto systémů a případné možnosti pro zlepšení.

Národní úložiště šedé literatury : Nalezeno 67 záznamů.   začátekpředchozí25 - 34dalšíkonec  přejít na záznam:
Chcete být upozorněni, pokud se objeví nové záznamy odpovídající tomuto dotazu?
Přihlásit se k odběru RSS.