Original title:
Continuous Q-learning application
Translated title:
Aplikace metody spojitého Q-učení
Authors:
Věchet, S. ; Krejsa, Jiří ; Míček, P. Document type: Papers Conference/Event: Engineering mechanics 2004, Svratka (CZ), 2004-05-10 / 2004-05-13
Year:
2004
Language:
eng Abstract:
[eng][cze] Standard algorithm of Q-Learning is limited by discrete states and actions and Q-functionis usually represented as discrete table. To avoid this obstacle and extendthe use of Q-learning for continuous states and actions the algorithm must bemodified and such modification is presented in the paper. Straightforward way isto replace discrete table with suitable approximator.Standardní algoritmus Q-učení je omezen na použití diskrétních stavů a akcí a Q-funkce je obvykle reprezentována diskrétní tabulkou. Aby bylo možno se tomuto omezení vyhnout a rozšířit použití Q-učení na spojité stavy a akce, bylo nutné algoritmus modifikovat. Tato modifikace je předmětem článku. Diskrétní tabulka je zde nahrazena vhodným aproximátorem.
Keywords:
approximation; Q-learnig Project no.: CEZ:AV0Z2076919 (CEP) Host item entry: Engineering mechanics 2004, ISBN 80-85918-88-9
Institution: Institute of Thermomechanics AS ČR
(web)
Document availability information: Fulltext is available at the institute of the Academy of Sciences. Original record: http://hdl.handle.net/11104/0010992