National Repository of Grey Literature 4 records found  Search took 0.00 seconds. 
Guided Reinforcement Learning for Motor Skills
Karabelly, Jozef ; Herout, Adam (referee) ; Hradiš, Michal (advisor)
Cieľom tejto práce je prezentovať prehľad aktuálneho výskumu v oblasti posilovaného učenia pohybu s predlohou a identifikovať potenciálne smery výskumu. Okrem toho práca predstavuje vylepšenú metódu učenia fyzikálne simulovaných animácií postáv založenú na aktuálnych metódach. Predtrénovaný model ukazuje potenciál lepších výsledkov na rôznych nových úlohách. Vlastný dataset bol nazbieraný pre účely pretrénovania modelu predstaveného v tejto práci. Na základe výsledkov z vykonaných experimentov sú odprezentované možné budúce vylepšenia a smery výskumu.
Reinforcement Learning for Bomberman Type Game
Adamčiak, Jakub ; Beran, Vítězslav (referee) ; Hradiš, Michal (advisor)
This bachelor's thesis aims to develop, implement and train reinforcement learning models for a Bomberman-type game. It is based on Bomberland environment from CoderOne. This environment was created for education and research in the field of artificial intelligence. In this thesis I tackle the settings and problems of implementing agent into the environment. I used 2 policies (MLP and CNN), 2 algorithms (PPO and A2C) and 5 setups of neural networks for feature extraction with the use of libraries stable baselines 3 and pytorch. Total training time resulted in 1207 real-world hours, 4168 computing hours and 271 milions of time steps. Although the training was not successful, this thesis shows the process of implementing a reinforcement learning model into a Gym environment.
Deep Learning Methods for Machine Playing the Scotland Yard Board Game
Hrkľová, Zuzana ; Janoušek, Vladimír (referee) ; Zbořil, František (advisor)
Táto práca sa zaoberá metódami hlbokého učenia, ktoré sú aplikovateľné na stolné hry s neurčitosťou. V rámci práce boli naštudované princípy učenia s posilňovaním, s hlavným zameraním na Q-learning algoritmy, spomedzi ktorých bol vybraný Deep Q-Network algoritmus. Ten bol následne implementovaný na zjednodušených pravidlách stolnej hry Scotland Yard. Konečná implementácia bola porovnaná s metódami Alpha-Beta a Monte Carlo Tree Search. S výsledkov vyplinulo, že schovávaný hráč riadený DQN algoritmom predstavoval pre ostatné metódy najťažšieho protihráča, narozdiel od hľadajúcich hráčov, ktorým sa nepodarilo zlepšiť existujúce riešenia. Napriek tomu, že implementovaná metóda nedosiahla lepšie výsledky oproti doposiaľ existujúcim metódam, ukázalo sa, že potrebuje najmenej výpočetných zdrojov a času na vykonanie daného ťahu. To ju robí najperspektívnejšou zo spomínaných metód na budúcu možnú implementáciu originálnej verzie danej hry.
Reinforcement Learning for Bomberman Type Game
Adamčiak, Jakub ; Beran, Vítězslav (referee) ; Hradiš, Michal (advisor)
This bachelor's thesis aims to develop, implement and train reinforcement learning models for a Bomberman-type game. It is based on Bomberland environment from CoderOne. This environment was created for education and research in the field of artificial intelligence. In this thesis I tackle the settings and problems of implementing agent into the environment. I used 2 policies (MLP and CNN), 2 algorithms (PPO and A2C) and 5 setups of neural networks for feature extraction with the use of libraries stable baselines 3 and pytorch. Total training time resulted in 1207 real-world hours, 4168 computing hours and 271 milions of time steps. Although the training was not successful, this thesis shows the process of implementing a reinforcement learning model into a Gym environment.

Interested in being notified about new results for this query?
Subscribe to the RSS feed.