Název:
Posilované učení pro hraní robotického fotbalu
Překlad názvu:
Reinforcement Learning for RoboCup
Autoři:
Bočán, Hynek ; Škoda, Petr (oponent) ; Smrž, Pavel (vedoucí práce) Typ dokumentu: Bakalářské práce
Rok:
2017
Jazyk:
cze
Nakladatel: Vysoké učení technické v Brně. Fakulta informačních technologií
Abstrakt: [cze][eng]
Tato práce se zabývá tvorbou umělé inteligence schopné ovládat robotického hráče fotbalu simulovaného v prostředí SimSpark. Vytvořená umělá inteligence rozšiřuje již hotového agenta, který poskytuje implementaci základních dovedností jako je orientace na hřišti, pohyb v osmi směrech a nebo driblování s balonem. Umělá inteligence se stará o výběr nejvhodnější akce v závislosti na situaci na hřišti. Pro její implementaci byla použita metoda posilovaného učení - Q-learning. Pro výběr nejlepší akce je situace na hřišti převedena do formy 2D obrazu s několika rovinami. Tento obraz je následně analyzován hlubokou konvoluční neuronovou sítí implementované pomocí C++ knihovny DeepCL.
Goal of this thesis is creation of artificial intelligence capable of controlling robotic soccer player simulated in SimSpark environment. Agent created is expanding capabilities of existing third party agent which provides set of basic skills such as localization on the field, dribbling with the ball and omnidirectional walk. Responsibility of the created agent is to pick the best action based current state of the game. This decision making was implemented using reinforcement learning and its method Q-learning. State of the game is transformed into 2D picture with several planes. This picture is then analyzed using deep convolution neural network implemented using C++ and DeepCL library.
Klíčová slova:
hluboké neuronové sítě; konvoluční neuronové sítě; posilované učení; Q-learning; RoboCup; robotický fotbal; Strojové učení; convolution neural networks; deep neural networks; Machine learning; Q-learning; reinforcement learning; RoboCup; robotic soccer
Instituce: Vysoké učení technické v Brně
(web)
Informace o dostupnosti dokumentu:
Plný text je dostupný v Digitální knihovně VUT. Původní záznam: http://hdl.handle.net/11012/69787