Original title:
Diferenciovatelný návrh architektury neuronových sítí
Translated title:
Differentiable Neural Network Architecture Search
Authors:
Eichler, Vojtěch ; Piňos, Michal (referee) ; Mrázek, Vojtěch (advisor) Document type: Bachelor's theses
Year:
2023
Language:
cze Publisher:
Vysoké učení technické v Brně. Fakulta informačních technologií Abstract:
[cze][eng]
Cílem této práce je navrhnout systém pro diferencovatelný návrh architektury neuronových sítí, který následně umožní experimentovat s návrhem různých typů neuronových sítí. Práce vychází z nové metody DARTS (Differentiable architecture search) a přináší její implementaci v knihovně TensorFlow verze 2, kde nebyla k dispozici. Následně jsou v této práci popsány experimenty s operacemi běžných konvolučních sítí, konvolučních sítí s vrstvami využívajícími aproximačních násobiček a s operacemi kombinujícími mechanismy pozornosti a konvoluce. Přínosem této práce je tedy systém pro diferencovatelný návrh architektury neuronových sítí, který umožňuje experimenty s různými vrstvami z moderních verzí knihovny TensorFlow.
The aim of this work is to propose a system for differentiable architecture search, which can be used for design of some neural network types. The work is based on the DARTS (Differentiable architecture search) approach and implements similar system in TensorFlow. Experiments with regular convolution neural networks, convolution neural networks using approximate multipliers and neural networks combining attention and convolution machanisms are presented. The main contribution of this work is novel implementation of a diferentiable architecture search system supporting various layers from the recent versions of the TensorFlow library.
Keywords:
artificial intelligence; convolutional neural networks; deep learning; differentiable architecture search; machine learning; network architecture search; neural networks; TensorFlow; automatický návrh neuronových sítí; diferencovatelný návrh architektury; hluboké učení; konvoluční neuronové sítě; neuronové sítě; strojové učení; TensorFlow; umělá inteligence
Institution: Brno University of Technology
(web)
Document availability information: Fulltext is available in the Brno University of Technology Digital Library. Original record: http://hdl.handle.net/11012/211040