keywords:"částečně pozorovatelný Markovův rozhodovací proces" - Výsledky hledání - Digitální repozitář

host :: přihlásit Digitální repozitář
		Hledej		Nový záznam		Nápověda		O repozitáři

Hlavní stránka > Výsledky hledání: keywords:"částečně pozorovatelný Markovův rozhodovací proces"

Hledej:

Tipy pro vyhledávaní :: Rozšířené hledání

Hledej ve sbírkách:

Seřadit podle:	Zobrazit výsledky:	Výstupní formát:

	Strojové učení ve strategických hrách Vlček, Michael ; Škoda, Petr (oponent) ; Smrž, Pavel (vedoucí práce) Strojové učení v současnosti diktuje pokrok umělé inteligence v soupeření s člověkem v rámci strategických her, ať už jde o šachy, Go, či poker. Oblastí strojového učení, která vykazuje nejperspektivnější výsledky ve hraní strategických her, je posilované učení. Velkým milníkem se pro současný vývoj stává počítačová hra Starcraft II, která svou komplexností mnohonásobně předčí dosavadní úspěchy v tomto oboru. Tato práce se zabývá rozborem problematiky, a navrhuje řešení prostřednictvím algoritmu posilovaného učení A2C a implementace optimalizace hyperparametrů PBT (trénování na bázi populace), které může být pro dosavadní výsledky krokem vpřed. Úplný záznam
	Inductive Controller Synthesis for POMDPs with Respect to Steady-State Properties Jarolím, Antonín ; Kozák, David (oponent) ; Češka, Milan (vedoucí práce) This thesis considers the problem of synthesizing finite-state controllers (FSC) for partially observable Markov decision processes wrt. steady-state properties. The set of candidate FSCs (design-space) is explored using state-of-the-art synthesis methods. The Abstraction-Refinement (AR) method prunes the design-space by considering families of FSCs at once. The novel algorithm generating counter-examples regarding steady-state properties using principles of the counterexample-guided inductive synthesis method is proposed. The experimental evaluation compares the AR method with a one-by-one exploration. It shows that the AR method is faster by orders of magnitude in all but one example, where the low transition rates reduced the speed of the AR method. No other tool is capable of performing such synthesis, so a comparison with other approaches is not available. Úplný záznam
	Strojové učení ve strategických hrách Vlček, Michael ; Škoda, Petr (oponent) ; Smrž, Pavel (vedoucí práce) Strojové učení v současnosti diktuje pokrok umělé inteligence v soupeření s člověkem v rámci strategických her, ať už jde o šachy, Go, či poker. Oblastí strojového učení, která vykazuje nejperspektivnější výsledky ve hraní strategických her, je posilované učení. Velkým milníkem se pro současný vývoj stává počítačová hra Starcraft II, která svou komplexností mnohonásobně předčí dosavadní úspěchy v tomto oboru. Tato práce se zabývá rozborem problematiky, a navrhuje řešení prostřednictvím algoritmu posilovaného učení A2C a implementace optimalizace hyperparametrů PBT (trénování na bázi populace), které může být pro dosavadní výsledky krokem vpřed. Úplný záznam

Chcete být upozorněni, pokud se objeví nové záznamy odpovídající tomuto dotazu?
Přihlásit se k odběru RSS.

Digitální repozitář :: :: :: ::
Powered by v1.1.2
Spravuje

Tato stránka je dostupná také v následujících jazycích:
Česky English