Název:
Continuous Q-learning application
Překlad názvu:
Aplikace metody spojitého Q-učení
Autoři:
Věchet, S. ; Krejsa, Jiří ; Míček, P. Typ dokumentu: Příspěvky z konference Konference/Akce: Engineering mechanics 2004, Svratka (CZ), 2004-05-10 / 2004-05-13
Rok:
2004
Jazyk:
eng
Abstrakt: [eng][cze] Standard algorithm of Q-Learning is limited by discrete states and actions and Q-functionis usually represented as discrete table. To avoid this obstacle and extendthe use of Q-learning for continuous states and actions the algorithm must bemodified and such modification is presented in the paper. Straightforward way isto replace discrete table with suitable approximator.Standardní algoritmus Q-učení je omezen na použití diskrétních stavů a akcí a Q-funkce je obvykle reprezentována diskrétní tabulkou. Aby bylo možno se tomuto omezení vyhnout a rozšířit použití Q-učení na spojité stavy a akce, bylo nutné algoritmus modifikovat. Tato modifikace je předmětem článku. Diskrétní tabulka je zde nahrazena vhodným aproximátorem.
Klíčová slova:
approximation; Q-learnig Číslo projektu: CEZ:AV0Z2076919 (CEP) Zdrojový dokument: Engineering mechanics 2004, ISBN 80-85918-88-9
Instituce: Ústav termomechaniky AV ČR
(web)
Informace o dostupnosti dokumentu:
Dokument je dostupný v příslušném ústavu Akademie věd ČR. Původní záznam: http://hdl.handle.net/11104/0010992