Original title:
Stochastická strategie při Q-učení užitá pro řízení AML
Translated title:
Stochastic policy in Q-lerning used for control of AMB
Authors:
Březina, Tomáš ; Krejsa, Jiří ; Věchet, S. Document type: Papers Conference/Event: National conference with international participation Engineering Mechanics 2002, Svratka (CZ), 2002-05-13 / 2002-05-16
Year:
2002
Language:
cze Abstract:
[cze][eng] V poslední době je značná pozornost věnována metodám opakovaně posilovaného učení (RL). Článek se zabývá zlepšením RL metody bez modelu známé jako Q-učení, použité na modelu aktivního magnetického ložiska. Stochastická strategie a adaptivní integrační krok zvýšily rychlost učení přibližně stokrát. Nemožnost spřaženého použití navrženého zlepšení je nevýhodou, i když jej může být použito při předučení s následným provedením spřaženého doučování.A great intention is lately focused on Reinforcement Learning (RL) methods. The article is focused on improving model free RL method known as Q-learning used on active magnetic bearing model. Stochastic strategy and adaptive integration step increased the speed of learning approximately hundred times. Impossibility of using proposed improvement online is the only drawback, however it might be used for pretraining and further fined online.
Keywords:
control; magnetic bearing; Q-learning Project no.: GA101/00/1471 (CEP) Funding provider: GA ČR Host item entry: Inženýrská mechanika 2002, ISBN 80-214-2109-6
Institution: Institute of Thermomechanics AS ČR
(web)
Document availability information: Fulltext is available at the institute of the Academy of Sciences. Original record: http://hdl.handle.net/11104/0107658