| |
| |
| |
| |
|
Stochastická strategie při Q-učení užitá pro řízení AML
Březina, Tomáš ; Krejsa, Jiří ; Věchet, S.
V poslední době je značná pozornost věnována metodám opakovaně posilovaného učení (RL). Článek se zabývá zlepšením RL metody bez modelu známé jako Q-učení, použité na modelu aktivního magnetického ložiska. Stochastická strategie a adaptivní integrační krok zvýšily rychlost učení přibližně stokrát. Nemožnost spřaženého použití navrženého zlepšení je nevýhodou, i když jej může být použito při předučení s následným provedením spřaženého doučování.
|
| |
|
Aplikace metody spojitého Q-učení
Věchet, S. ; Krejsa, Jiří ; Míček, P.
Standardní algoritmus Q-učení je omezen na použití diskrétních stavů a akcí a Q-funkce je obvykle reprezentována diskrétní tabulkou. Aby bylo možno se tomuto omezení vyhnout a rozšířit použití Q-učení na spojité stavy a akce, bylo nutné algoritmus modifikovat. Tato modifikace je předmětem článku. Diskrétní tabulka je zde nahrazena vhodným aproximátorem.
|
| |
| |
| |