Národní úložiště šedé literatury Nalezeno 4 záznamů.  Hledání trvalo 0.00 vteřin. 
Hraní her s neurčitostí
Bajza, Jakub ; Zbořil, František (oponent) ; Zbořil, František (vedoucí práce)
Tato bakalářská práce se zabývá implementací algoritmu expectiminimax pro hry s nulovým součtem.  Poukazuje na komplikace, které mohou nastat, při aplikaci algoritmu expectiminimax na složitější hry  z této kategorie. V rámci práce je také podán způsob tvorby ohodnocovací funkce pro počítačového  oponenta. Použitelnost ohodnocovacích funkcí je demonstrována sadou testů, ve kterých jsou proti  sobě postaveni hráč a počítačový oponent, nebo dva počítačoví oponenti.
Hraní nedeterministických her s učením
Bukovský, Marek ; Rozman, Jaroslav (oponent) ; Zbořil, František (vedoucí práce)
Práce se věnuje studiu a implementaci metod použitých pro učení z průběhu hraní. Zvolenou hrou pro tuhle práci jsou Vrhcáby. Algoritmus použitý pro učení neuronové sítě se nazývá učení z časového rozdílu s použitím stop vhodnosti. Tento algoritmus je známý i pod jménem TD(lambda). V teoretické části práce jsou popsány algoritmy pro hraní her bez učení, úvod do posilovaného učení, učení z časových rozdílů a úvod do umělých úvod neuronových sítí. Praktická část se zabývá aplikováním kombinace neuronových sítí a TD(lambda) algoritmů.
Hraní her s neurčitostí
Bajza, Jakub ; Zbořil, František (oponent) ; Zbořil, František (vedoucí práce)
Tato bakalářská práce se zabývá implementací algoritmu expectiminimax pro hry s nulovým součtem.  Poukazuje na komplikace, které mohou nastat, při aplikaci algoritmu expectiminimax na složitější hry  z této kategorie. V rámci práce je také podán způsob tvorby ohodnocovací funkce pro počítačového  oponenta. Použitelnost ohodnocovacích funkcí je demonstrována sadou testů, ve kterých jsou proti  sobě postaveni hráč a počítačový oponent, nebo dva počítačoví oponenti.
Hraní nedeterministických her s učením
Bukovský, Marek ; Rozman, Jaroslav (oponent) ; Zbořil, František (vedoucí práce)
Práce se věnuje studiu a implementaci metod použitých pro učení z průběhu hraní. Zvolenou hrou pro tuhle práci jsou Vrhcáby. Algoritmus použitý pro učení neuronové sítě se nazývá učení z časového rozdílu s použitím stop vhodnosti. Tento algoritmus je známý i pod jménem TD(lambda). V teoretické části práce jsou popsány algoritmy pro hraní her bez učení, úvod do posilovaného učení, učení z časových rozdílů a úvod do umělých úvod neuronových sítí. Praktická část se zabývá aplikováním kombinace neuronových sítí a TD(lambda) algoritmů.

Chcete být upozorněni, pokud se objeví nové záznamy odpovídající tomuto dotazu?
Přihlásit se k odběru RSS.