Vision Transformery pre vstavané platformy

Nemčeková, Barbora

Tato práce se zabývá zkoumáním Transformerů vidění pro úlohu klasifikace obrazu, jejich optimalizaci, a nasazení na vybrané vestavěné zařízení. Na vybraných vestavěných zařízení se doposud pro klasifikaci obrazu používaly konvoluční neuronové sítě, avšak s revolucí ve zpracování přirozeného jazyka vznikl zájem o zkoumání transformerů i pro úlohy počítačového vidění. Práce experimentuje s různými druhy kvantizace modelů, jako je int8 kvantizace, int16x8 kvantizace, dynamická kvantizace a SmoothQuant metoda. Výsledky ukazují, že ne všechny transformery vidění je možné kvantizovat s dostatečnou přesností, a to ani při použití specializované metody SmoothQuant. Taktéž se ukázalo, že kvantizovaný transformer model není možné akcelerovat na NPU vybraných zařízení. Ze zkoumaných faktorů, jako je přesnost po optimalizaci modelu, latence a využití paměti na vestavěném zařízení, konvoluční neuronové sítě stále převyšují modely transformerů.

guest :: login Digital Repository
		Search		Submit		Help		About