Název:
Strojové učení ve strategických hrách
Překlad názvu:
Machine Learning in Strategic Games
Autoři:
Vlček, Michael ; Škoda, Petr (oponent) ; Smrž, Pavel (vedoucí práce) Typ dokumentu: Diplomové práce
Rok:
2018
Jazyk:
cze
Nakladatel: Vysoké učení technické v Brně. Fakulta informačních technologií
Abstrakt: [cze][eng]
Strojové učení v současnosti diktuje pokrok umělé inteligence v soupeření s člověkem v rámci strategických her, ať už jde o šachy, Go, či poker. Oblastí strojového učení, která vykazuje nejperspektivnější výsledky ve hraní strategických her, je posilované učení. Velkým milníkem se pro současný vývoj stává počítačová hra Starcraft II, která svou komplexností mnohonásobně předčí dosavadní úspěchy v tomto oboru. Tato práce se zabývá rozborem problematiky, a navrhuje řešení prostřednictvím algoritmu posilovaného učení A2C a implementace optimalizace hyperparametrů PBT (trénování na bázi populace), které může být pro dosavadní výsledky krokem vpřed.
Machine learning is spearheading progress for the field of artificial intelligence in terms of providing competition in strategy games to a human opponent, be it in a game of chess, Go or poker. A field of machine learning, which shows the most promising results in playing strategy games, is reinforcement learning. The next milestone for the current research lies in a computer game Starcraft II, which outgrows the previous ones in terms of complexity, and represents a potential new breakthrough in this field. The paper focuses on analysis of the problem, and suggests a solution incorporating a reinforcement learning algorithm A2C and hyperparameter optimization implementation PBT, which could mean a step forward for the current progress.
Klíčová slova:
A2C; A3C; agent.; neuronová sít; optimalizace hyperparametrů; posilované učení; SC2LE; Starcraft II; strategie; Strojové učení; trénování na bázi populace; částečně pozorovatelný Markovův rozhodovací proces; A2C; A3C; agent.; hyperparameter optimization; Machine learning; neural network; partially observable Markov decision process; Population Based Training; reinforcement learning; SC2LE; Starcraft II; strategy
Instituce: Vysoké učení technické v Brně
(web)
Informace o dostupnosti dokumentu:
Plný text je dostupný v Digitální knihovně VUT. Původní záznam: http://hdl.handle.net/11012/84976