National Repository of Grey Literature 4 records found  Search took 0.01 seconds. 
Neural Network Implementation without Multiplication
Slouka, Lukáš ; Baskar, Murali Karthick (referee) ; Szőke, Igor (advisor)
The subject of this thesis is neural network acceleration with the goal of reducing the number of floating point multiplications. The theoretical part of the thesis surveys current trends and methods used in the field of neural network acceleration. However, the focus is on the binarization techniques which allow replacing multiplications with logical operators. The theoretical base is put into practice in two ways. First is the GPU implementation of crucial binary operators in the Tensorflow framework with a performance benchmark. Second is an application of these operators in simple image classifier. Results are certainly encouraging. Implemented operators achieve speed-up by a factor of 2.5 when compared to highly optimized cuBLAS operators. The last chapter compares accuracies achieved by binarized models and their full-precision counterparts on various architectures.
Model Compression of Denoising Diffusion Probabilistic Models for Image Generation
Dobiš, Lukáš ; Kišš, Martin (referee) ; Hradiš, Michal (advisor)
Táto diplomová práca sa zameriava na optimalizáciu výpočtovej efektívnosti generatívnych difúznych modelov skrz vyhodnotenie konvenčných metód komprimácie neurónovych sieti na architektúre Denoising Diffusion Probabilistic Model (DDPM). Modelová komprimácia bola vykonaná na parametroch predtrénovanéj sieti DDPM niekoľkými kvantizačnými a prerezávacími metódami. Tieto metódy boli vyhodnotené na troch rôznych obrázkových dátových sadách. Výsledky potvrdzujú, že implementované kompresné metódy sú vhodne pre nasadenie difúznych modelov na malých zariadeniach s obmedzenými zdrojmi alebo na zníženie ich výpočetnych prevádzkových nákladov.
Detection and Classification of Vehicles for Embedded Platforms
Skaloš, Patrik ; Hradiš, Michal (referee) ; Špaňhel, Jakub (advisor)
Táto práca hodnotí kompromisy rýchlosti a presnosti najmodernejších detektorov objektov YOLOv8 pre detekciu vozidiel v snímkoch z monitorovacích kamier na vstatných a nízkovýkonných zariadeniach. Modely YOLOv8 rôznych veľkostí, vrátane jedného s efektívnou sieťou MobileNetV2 na extrakciu príznakov a modelu YOLOv8-femto s menej ako \num{60000} parametrami, boli testované na šiestich zariadeniach, vrátane troch vstavaných platforiem z rodiny NVIDIA Jetson a počítačom Raspberry Pi 4B s nízkou výpočtovou silou. V práci boli zohľadnené rôzne faktory ovplyvňujúce výkonnosť modelov, ako napríklad ich kvantizácia, rozlíšenia vstupu, inferenčné knižnice a veľkosti dávok počas inferencie. Táto štúdia poskytuje užitočné informácie k vývoju a nasadeniu detektorov vozidiel na širokú škálu zariadení, od nízkovýkonných procesorov po špecializované vstavané platformy.
Neural Network Implementation without Multiplication
Slouka, Lukáš ; Baskar, Murali Karthick (referee) ; Szőke, Igor (advisor)
The subject of this thesis is neural network acceleration with the goal of reducing the number of floating point multiplications. The theoretical part of the thesis surveys current trends and methods used in the field of neural network acceleration. However, the focus is on the binarization techniques which allow replacing multiplications with logical operators. The theoretical base is put into practice in two ways. First is the GPU implementation of crucial binary operators in the Tensorflow framework with a performance benchmark. Second is an application of these operators in simple image classifier. Results are certainly encouraging. Implemented operators achieve speed-up by a factor of 2.5 when compared to highly optimized cuBLAS operators. The last chapter compares accuracies achieved by binarized models and their full-precision counterparts on various architectures.

Interested in being notified about new results for this query?
Subscribe to the RSS feed.