Název:
Stochastická strategie při Q-učení užitá pro řízení AML
Překlad názvu:
Stochastic policy in Q-lerning used for control of AMB
Autoři:
Březina, Tomáš ; Krejsa, Jiří ; Věchet, S. Typ dokumentu: Příspěvky z konference Konference/Akce: National conference with international participation Engineering Mechanics 2002, Svratka (CZ), 2002-05-13 / 2002-05-16
Rok:
2002
Jazyk:
cze
Abstrakt: [cze][eng] V poslední době je značná pozornost věnována metodám opakovaně posilovaného učení (RL). Článek se zabývá zlepšením RL metody bez modelu známé jako Q-učení, použité na modelu aktivního magnetického ložiska. Stochastická strategie a adaptivní integrační krok zvýšily rychlost učení přibližně stokrát. Nemožnost spřaženého použití navrženého zlepšení je nevýhodou, i když jej může být použito při předučení s následným provedením spřaženého doučování.A great intention is lately focused on Reinforcement Learning (RL) methods. The article is focused on improving model free RL method known as Q-learning used on active magnetic bearing model. Stochastic strategy and adaptive integration step increased the speed of learning approximately hundred times. Impossibility of using proposed improvement online is the only drawback, however it might be used for pretraining and further fined online.
Klíčová slova:
control; magnetic bearing; Q-learning Číslo projektu: GA101/00/1471 (CEP) Poskytovatel projektu: GA ČR Zdrojový dokument: Inženýrská mechanika 2002, ISBN 80-214-2109-6
Instituce: Ústav termomechaniky AV ČR
(web)
Informace o dostupnosti dokumentu:
Dokument je dostupný v příslušném ústavu Akademie věd ČR. Původní záznam: http://hdl.handle.net/11104/0107658