Original title:
Strojové učení ve strategických hrách
Translated title:
Machine Learning in Strategic Games
Authors:
Vlček, Michael ; Škoda, Petr (referee) ; Smrž, Pavel (advisor) Document type: Master’s theses
Year:
2018
Language:
cze Publisher:
Vysoké učení technické v Brně. Fakulta informačních technologií Abstract:
[cze][eng]
Strojové učení v současnosti diktuje pokrok umělé inteligence v soupeření s člověkem v rámci strategických her, ať už jde o šachy, Go, či poker. Oblastí strojového učení, která vykazuje nejperspektivnější výsledky ve hraní strategických her, je posilované učení. Velkým milníkem se pro současný vývoj stává počítačová hra Starcraft II, která svou komplexností mnohonásobně předčí dosavadní úspěchy v tomto oboru. Tato práce se zabývá rozborem problematiky, a navrhuje řešení prostřednictvím algoritmu posilovaného učení A2C a implementace optimalizace hyperparametrů PBT (trénování na bázi populace), které může být pro dosavadní výsledky krokem vpřed.
Machine learning is spearheading progress for the field of artificial intelligence in terms of providing competition in strategy games to a human opponent, be it in a game of chess, Go or poker. A field of machine learning, which shows the most promising results in playing strategy games, is reinforcement learning. The next milestone for the current research lies in a computer game Starcraft II, which outgrows the previous ones in terms of complexity, and represents a potential new breakthrough in this field. The paper focuses on analysis of the problem, and suggests a solution incorporating a reinforcement learning algorithm A2C and hyperparameter optimization implementation PBT, which could mean a step forward for the current progress.
Keywords:
A2C; A3C; agent.; hyperparameter optimization; Machine learning; neural network; partially observable Markov decision process; Population Based Training; reinforcement learning; SC2LE; Starcraft II; strategy; A2C; A3C; agent.; neuronová sít; optimalizace hyperparametrů; posilované učení; SC2LE; Starcraft II; strategie; Strojové učení; trénování na bázi populace; částečně pozorovatelný Markovův rozhodovací proces
Institution: Brno University of Technology
(web)
Document availability information: Fulltext is available in the Brno University of Technology Digital Library. Original record: http://hdl.handle.net/11012/84976