Název:
Mean variance optimality in Markov decision chains
Překlad názvu:
Optimalita prumerne variance v markovskych rozhodovacich procesech
Autoři:
Sladký, Karel ; Sitař, Milan Typ dokumentu: Příspěvky z konference Konference/Akce: Mathematical Methods in Economics 2005 /23./, Hradec Králové (CZ), 2005-09-14 / 2005-09-16
Rok:
2005
Jazyk:
eng
Abstrakt: [eng][cze] In this note, we consider discrete-time Markov decision processes with finite state space. Recalling explicit formulas for the growth rate of expected value and variance of the cumulative (random) reward, algorithmic procedures for finding optimal policies with respect to various mean variance optimality criteria are discussed. Computational experience with large scale numerical examples is reported.V praci se studuji diskretni markovske rozhodovaci procesy s konecnym stavovym prostorem. Vyuzitim explicitnich vztahu pro rychlost rustu ocekavanych hodnot, jakoz i rozptylu kumulativniho (nahodneho) vynosu, jsou navrzeny algorithnmicke postupy pro nalezeni optimalniho rizeni vzhledem k ruznym kriteriim.
Klíčová slova:
expectation and variance of cumulative rewards; Markov reward processes Číslo projektu: CEZ:AV0Z10750506 (CEP), GA402/05/0115 (CEP) Poskytovatel projektu: GA ČR Zdrojový dokument: Proceedings of the 23rd International Conference Mathematical Methods in Economics 2005, ISBN 978-80-7041-535-1
Instituce: Ústav teorie informace a automatizace AV ČR
(web)
Informace o dostupnosti dokumentu:
Dokument je dostupný v příslušném ústavu Akademie věd ČR. Původní záznam: http://hdl.handle.net/11104/0131524