|
Hraní her s neurčitostí
Bajza, Jakub ; Zbořil, František (oponent) ; Zbořil, František (vedoucí práce)
Tato bakalářská práce se zabývá implementací algoritmu expectiminimax pro hry s nulovým součtem. Poukazuje na komplikace, které mohou nastat, při aplikaci algoritmu expectiminimax na složitější hry z této kategorie. V rámci práce je také podán způsob tvorby ohodnocovací funkce pro počítačového oponenta. Použitelnost ohodnocovacích funkcí je demonstrována sadou testů, ve kterých jsou proti sobě postaveni hráč a počítačový oponent, nebo dva počítačoví oponenti.
|
|
Hraní nedeterministických her s učením
Bukovský, Marek ; Rozman, Jaroslav (oponent) ; Zbořil, František (vedoucí práce)
Práce se věnuje studiu a implementaci metod použitých pro učení z průběhu hraní. Zvolenou hrou pro tuhle práci jsou Vrhcáby. Algoritmus použitý pro učení neuronové sítě se nazývá učení z časového rozdílu s použitím stop vhodnosti. Tento algoritmus je známý i pod jménem TD(lambda). V teoretické části práce jsou popsány algoritmy pro hraní her bez učení, úvod do posilovaného učení, učení z časových rozdílů a úvod do umělých úvod neuronových sítí. Praktická část se zabývá aplikováním kombinace neuronových sítí a TD(lambda) algoritmů.
|
|
Hraní her s neurčitostí
Bajza, Jakub ; Zbořil, František (oponent) ; Zbořil, František (vedoucí práce)
Tato bakalářská práce se zabývá implementací algoritmu expectiminimax pro hry s nulovým součtem. Poukazuje na komplikace, které mohou nastat, při aplikaci algoritmu expectiminimax na složitější hry z této kategorie. V rámci práce je také podán způsob tvorby ohodnocovací funkce pro počítačového oponenta. Použitelnost ohodnocovacích funkcí je demonstrována sadou testů, ve kterých jsou proti sobě postaveni hráč a počítačový oponent, nebo dva počítačoví oponenti.
|
|
Hraní nedeterministických her s učením
Bukovský, Marek ; Rozman, Jaroslav (oponent) ; Zbořil, František (vedoucí práce)
Práce se věnuje studiu a implementaci metod použitých pro učení z průběhu hraní. Zvolenou hrou pro tuhle práci jsou Vrhcáby. Algoritmus použitý pro učení neuronové sítě se nazývá učení z časového rozdílu s použitím stop vhodnosti. Tento algoritmus je známý i pod jménem TD(lambda). V teoretické části práce jsou popsány algoritmy pro hraní her bez učení, úvod do posilovaného učení, učení z časových rozdílů a úvod do umělých úvod neuronových sítí. Praktická část se zabývá aplikováním kombinace neuronových sítí a TD(lambda) algoritmů.
|