Original title:
Hraní deterministických her s učením
Translated title:
Deterministic Games Playing with Learning
Authors:
Knoflíček, Jakub ; Rozman, Jaroslav (referee) ; Zbořil, František (advisor) Document type: Bachelor's theses
Year:
2011
Language:
cze Publisher:
Vysoké učení technické v Brně. Fakulta informačních technologií Abstract:
[cze][eng]
Tato práce se zabývá tvorbou umělé inteligence pro počítačového hráče deterministických her, jako je například dáma. Je rozebrán princip myšlenky a metody pro nalezení nejlepšího tahu pro daný herní stav v rozsáhlém stavovém prostoru v kombinaci s metodou posilovaného učení, která nám umožňuje ohodnocení jednotlivých herních stavů. Práce zahrnuje také rozbor metody pro nalezení všech možných tahů v konkrétní implementované hře dáma, návrh efektivního nakládání s ohodnocenými herními stavy a mechanismus náhradního ohodnocení při absenci některého z nich. V závěru je výsledná aplikace podrobena souboru testů, v nichž je porovnána s konkurenčním programem a jsou rozebírány dosažené vlastnosti metod hledání nejlepšího tahu a posilovaného učení.
This paper deals with creating artificial intelligence for computer player for deterministic games such as checkers. It's analyzed principle of idea and method for best move searching for a current game state in very large state space in combination with method reinforcement learning which allows us to evaluate individual game states. The paper also involves analysis of method for finding all possible moves in concrete implemented game checkers, concept of effective treatment with evaluated game states and mechanism alternate evaluating in case the absence any of them. At the end is final application going in collection of tests where is compared with competitive program and the achieved properties of methods searching best move and reinforcement learning are analyzed.
Keywords:
Alfa-Beta pruning; Artificial intelligence; checkers; deterministic games; game states database; methods for game playing; possible moves finding.; reinforcement learning; temporal difference learning method; Alfa-Beta řezy; databáze herních stavů; deterministické hry; dáma; metoda temporal difference learning; metody pro hraní her; nalezení možných tahů.; posilované učení; Umělá inteligence
Institution: Brno University of Technology
(web)
Document availability information: Fulltext is available in the Brno University of Technology Digital Library. Original record: http://hdl.handle.net/11012/55742