Název:
Hraní deterministických her s učením
Překlad názvu:
Deterministic Games Playing with Learning
Autoři:
Knoflíček, Jakub ; Rozman, Jaroslav (oponent) ; Zbořil, František (vedoucí práce) Typ dokumentu: Bakalářské práce
Rok:
2011
Jazyk:
cze
Nakladatel: Vysoké učení technické v Brně. Fakulta informačních technologií
Abstrakt: [cze][eng]
Tato práce se zabývá tvorbou umělé inteligence pro počítačového hráče deterministických her, jako je například dáma. Je rozebrán princip myšlenky a metody pro nalezení nejlepšího tahu pro daný herní stav v rozsáhlém stavovém prostoru v kombinaci s metodou posilovaného učení, která nám umožňuje ohodnocení jednotlivých herních stavů. Práce zahrnuje také rozbor metody pro nalezení všech možných tahů v konkrétní implementované hře dáma, návrh efektivního nakládání s ohodnocenými herními stavy a mechanismus náhradního ohodnocení při absenci některého z nich. V závěru je výsledná aplikace podrobena souboru testů, v nichž je porovnána s konkurenčním programem a jsou rozebírány dosažené vlastnosti metod hledání nejlepšího tahu a posilovaného učení.
This paper deals with creating artificial intelligence for computer player for deterministic games such as checkers. It's analyzed principle of idea and method for best move searching for a current game state in very large state space in combination with method reinforcement learning which allows us to evaluate individual game states. The paper also involves analysis of method for finding all possible moves in concrete implemented game checkers, concept of effective treatment with evaluated game states and mechanism alternate evaluating in case the absence any of them. At the end is final application going in collection of tests where is compared with competitive program and the achieved properties of methods searching best move and reinforcement learning are analyzed.
Klíčová slova:
Alfa-Beta řezy; databáze herních stavů; deterministické hry; dáma; metoda temporal difference learning; metody pro hraní her; nalezení možných tahů.; posilované učení; Umělá inteligence; Alfa-Beta pruning; Artificial intelligence; checkers; deterministic games; game states database; methods for game playing; possible moves finding.; reinforcement learning; temporal difference learning method
Instituce: Vysoké učení technické v Brně
(web)
Informace o dostupnosti dokumentu:
Plný text je dostupný v Digitální knihovně VUT. Původní záznam: http://hdl.handle.net/11012/55742