Original title:
Komprese difuzních modelů pro generování obrazu
Translated title:
Model Compression of Denoising Diffusion Probabilistic Models for Image Generation
Authors:
Dobiš, Lukáš ; Kišš, Martin (referee) ; Hradiš, Michal (advisor) Document type: Master’s theses
Year:
2023
Language:
eng Publisher:
Vysoké učení technické v Brně. Fakulta informačních technologií Abstract:
[eng][cze]
Táto diplomová práca sa zameriava na optimalizáciu výpočtovej efektívnosti generatívnych difúznych modelov skrz vyhodnotenie konvenčných metód komprimácie neurónovych sieti na architektúre Denoising Diffusion Probabilistic Model (DDPM). Modelová komprimácia bola vykonaná na parametroch predtrénovanéj sieti DDPM niekoľkými kvantizačnými a prerezávacími metódami. Tieto metódy boli vyhodnotené na troch rôznych obrázkových dátových sadách. Výsledky potvrdzujú, že implementované kompresné metódy sú vhodne pre nasadenie difúznych modelov na malých zariadeniach s obmedzenými zdrojmi alebo na zníženie ich výpočetnych prevádzkových nákladov.
This thesis is dedicated to optimizating computation in generative diffusion models by evaluating conventional model compression aproaches on Denoising Diffusion Probabilistic Model (DDPM). Model compression was done on parameters of pretrained baseline DDPM neural network by several quantization and pruning methods. These methods were evaluated on three image dataset benchmarks. Results show that quantization and pruning are viable compression methods for downsizing diffusion networks, because they showed little decrease in quality of generated imagery. These results confirm that implemented compression approaches are vital for deployment of diffusion models on resource constrained Edge devices or to offset their compute costs.
Keywords:
difúzne modely; generatívna AI; kompresia neurónových sietí; kvantizácia; prerezávanie; diffusion models; generative AI; neural network compression; pruning; quantization
Institution: Brno University of Technology
(web)
Document availability information: Fulltext is available in the Brno University of Technology Digital Library. Original record: http://hdl.handle.net/11012/211959