National Repository of Grey Literature 79 records found  1 - 10nextend  jump to record: Search took 0.00 seconds. 
Reverse engineering of an audio mix using neural networks
Čermák, Jerguš ; Mokrý, Ondřej (referee) ; Rajmic, Pavel (advisor)
This bachelor's thesis focuses on the use of neural network algorithms to determine the parameters of signal processors used in the mixing of audio tracks. The thesis presents linear signal processors such as \emph{Gain}, \emph{Pan}, \emph{Filter}, and \emph{Reverb}, which are commonly used to process audio signal and to produce a stereo mix of the audio recording. These processors are subsequently used within the neural network model as layers, implemented using the DDSP library, aimed at predicting the parameters used in the mix, given the knowledge of the input tracks and the target mix. Resultantly, stereo mixdowns were created, and their parameters were estimated using two neural network models. The results were evaluated using both objective measurements and subjective methods (listening test).
Use of Diffusion Models in Deepfakes
Trúchly, Dominik ; Malinka, Kamil (referee) ; Lapšanský, Tomáš (advisor)
Deepfake je typ syntetického média vytvoreného pomocou sofistikovaných algoritmov strojového učenia, najmä hlbokých neurónových sietí. Ako príklad možno uviesť generatívne adverzné neurónové siete (GAN), ktoré sú schopné generovať obrázky, ktoré sú pre bežných jednotlivcov takmer nemožné odlíšiť od skutočnej reality. V dôsledku toho boli vyvinuté algoritmy detekcie hlbokých falošných správ, ktoré riešia tento rastúci problém. Tieto algoritmy využívajú pokročilé techniky strojového učenia a analyzujú rôzne funkcie v rámci obrázkov a videí, aby identifikovali nezrovnalosti alebo anomálie svedčiace o manipulácii. Táto práca skúma aplikáciu difúznych modelov, bežne používaných v digitálnom spracovaní obrazu na zvýšenie kvality obrazu znížením šumu a rozmazania, pre posilňovanie realizmu deepfakes. Využitím týchto modelov testujeme ich efekt na odhaľovanie deepfakes obrázkov pomocou deepfake detektorov.
Implementing gesture recognition on ARM as an alternative to traditional device control
Gajdošík, Richard ; Zbořil, František (referee) ; Kočí, Radek (advisor)
Cieľom tejto bakalárskej práce je vývoj a implementácia systému na rozpoznávanie gest s využitím architektúry ARM, konkrétne s použitím dosky i.MX 93 a TensorFlow Lite. Projekt sa zameriava na aplikáciu neurónových sietí pre rozpoznávanie gest rúk, čím poskytuje alternatívu k tradičným metódam ovládania zariadení. Dôležitou súčasťou práce je rozsiahla analýza existujúcich riešení rozpoznávania gest, zameraná na identifikáciu ich silných stránok a možných vylepšení. Práca detailne opisuje proces navrhovania, vývoja a optimalizácie modelu na rozpoznávanie gest v reálnom čase, špeciálne prispôsobeného pre čipy ARM s dôrazom na efektivitu a výkon. Okrem toho práca aj obsahuje vytvorenie demonštračnej aplikácie, ktorá vizuálne reprezentuje rozpoznané gestá. Užívateľské testovanie je uskutočnené na hodnotenie praktickosti a užívateľského zážitku systému rozpoznávania gest, čo poskytuje cennú spätnú väzbu pre budúce vylepšenia.
Neural Networks for Video Quality Enhancement
Sirovatka, Matej ; Juránek, Roman (referee) ; Hradiš, Michal (advisor)
Cieľom tejto práce je vytvoriť novú metódu super rozlíšenia na zlepšenie kvality videa. Táto metóda je založená na myšlienke použitia deformovateľných konvolučných vrstiev a optického toku na zarovnanie príznakov z viacerých po sebe následujúcích snímkov videa. Táto metóda je následne použitá v neuronovej sieti založenej na U-Net architektúre na predikciu snímkov vo vysokom rozlíšení. Vyhodnotenie je prevedené na datasete obsahujúcom snímky z reálneho života a porovnané s inými metódami. Testované sú rôzne konfigurácie navrhnutej metódy a výsledky sú analyzované. Výsledky experimentov ukazujú sľubné výsledky, pričom model prekonáva bilineárnu interpoláciu a metódy založené na jednom snímku. Testované sú rôzne architektúry modulu zarovnávania príznakov spolu s celou architektúrou U-Net, pričom sa ukazuje, že použitie Vgg19 ako enkóderu dáva najlepšie výsledky.
Very Low Bit-Rate Speech Coding Based on Neural Networks
Jochman, Stanislav ; Malenovský, Vladimír (referee) ; Černocký, Jan (advisor)
Vrámci tejto práce sme skúmali možnosti zlepšenia kvality zvuku produkovaným pomocou neurónovej siete LPCNet. Analyzovali sme vplyv použitia dátových setov zameraných na cieľový jazyk a ich vplyv na kvalitu výsledného zvuku. Pre meranie kvality kódovania reči sme využili hodnotiaci systém WARP-Q. Cieľom našej práce bolo navrhnúť vylepšenie trénovacieho dátového setu a použitie postfilterov pre zlepšenie kvality zvuku. Naše výsledky ukazujú merateľné zlepšenia s využitím malého slovenského dátového setu. Rovnako sme zaznamenali, že využitie dolnopriepustného filteru a filtra zlepšujúceho formanty zlepšilo kvalitu výsledného zvuku.
Overview of Actual Approaches to Classifications
Brezánský, Tomáš ; Rozman, Jaroslav (referee) ; Zbořil, František (advisor)
This bachelor thesis deals with an overview of current approaches to classifications. It describes various approaches to classifications and their algorithms, focuses on neural networks, Bayesian classifiers and decision trees. The main task of this work is to perform experiments with three classification algorithms, namely, the ID3 algorithm, the RCE neural network and the naive Bayesian classifier. The work contains experiments with given algorithms and evaluates the obtained results.
Named Entity Recognition Exploiting Sub Word Information
Dobrovodský, Patrik ; Egorova, Ekaterina (referee) ; Kesiraju, Santosh (advisor)
Cieľom tejto bakalárskej práce je zhotovenie systému rozpoznania názvoslovnej entity zhotovenej na základe modelu, ktorý bol nedávno považovaný za jeden z najmodernejších a popri tom skúma aký vplyv majú podslovné informácie na nahradenie slov mimo slovnej zásoby. Vytvorený systém vedľa anglického jazyka podporuje aj dva Indo-Európske jazyky konkrétne nemčinu a maďarčinu. Bakalárska práca predstavuje systém využívajúci hlboké učenie pre rozpoznávanie názvoslovných entít, ktorý používa predtrénované a samotrénované slovné vnorenia, zriedkavé vnorenia a charakterové vnorenia vyzdvihnuté konvolučnou neurónovou sieťou. Tieto vnorenia najprv spracujeme sekvenčnou (dlhodobá-krátkodobá pamäť) a potom charakteristickou (podmienené náhodné pole) metódou. Cieľom je dosiahnuť podobnú F1-mieru akú má inšpiračný model s možnosťou porovnania s ostatnými modernými systémami. Výsledkom našej práce je systém, ktorý na anglickej testovacej sade CoNLL 2003 dosiahol 90.98%-né F1-mieru používajúci predtrénované vnorenia a približuje sa k inšpiračnej práci s hodnotou 91.26%. V prípade ďalších jazykov používajúcich samotrénované slovné vnorenia dosiahol systém na testovacej sade WikiAnn pre nemčinu 89.34%-nú a pre maďarčinu 93.04%-nú F1-mieru.
Vehicle License Plate Detection and Recognition Software
Masaryk, Adam ; Hradiš, Michal (referee) ; Špaňhel, Jakub (advisor)
The aim of this bachelor thesis is to design and develop software that can detect and recognize license plates from images. The software is divided into 3 parts - license plates detection, detector output processing and license plates characters recognition. We decided to implement detection and recognition using modern methods using convolutional neural networks.
Horizon Detection in Image
Holková, Natália ; Herout, Adam (referee) ; Juránek, Roman (advisor)
Cieľom tejto práce je naimplementovať metódu detekovania horizontu vo fotografii pomocou hlbokého učenia, aby sa zabránilo obmedzeniam pre vstupné dáta. Trénovací dataset bol vytvorený sťahovaním obrázkov z miest z celého sveta pomocou služby Google Street View. Bolo vybratých niekoľko populárnych architektúr pre konvolučné neurónové siete a po natrénovaní boli vyhodnotené na existujúcich testovacích datasetoch.
Deep Neural Networks Used for Customer Support Cases Analysis
Marušic, Marek ; Ryšavý, Ondřej (referee) ; Pluskal, Jan (advisor)
Umelá inteligencia je pozoruhodne populárna v dnešnej dobe, pretože si dokáže poradiť s rôznymi veľmi komplexnými úlohami v odvetviach ako napr. spracovanie obrazu, spracovanie zvuku, spracovanie prirodzeného jazyka a podobne. Keďže Red Hat doteraz už vyriešil obrovksé množstvo zákazníckych požiadavkov počas podpory rôznych produktov. Preto bola navrhnutá myšlienka použiť umelú inteligenciu práve na tieto dáta a docieliť tak zlepšenie a zrýchlenie procesu riešenia zákaznícky požiadavkov. V tejto práci sú popísané použité techniky na spracovanie týchto dát a úlohy, ktoré je možné riešiť pomocou hlbokých neurónových sietí. Taktiež sú v tejto práci popísane rôzne modely, ktoré boli vytvorené počas riešenia tejto práce a snažia sa adresovať rôzne úlohy. Ich výkony sú porovnané na spomínaných úlohách.

National Repository of Grey Literature : 79 records found   1 - 10nextend  jump to record:
Interested in being notified about new results for this query?
Subscribe to the RSS feed.