Název: Balancing Exploitation and Exploration via Fully Probabilistic Design of Decision Policies
Autoři: Kárný, Miroslav ; Hůla, František
Typ dokumentu: Výzkumné zprávy
Rok: 2018
Jazyk: eng
Edice: Research Report, svazek: 2376
Abstrakt: Adaptive decision making learns an environment model serving a design of a decision policy. The policy-generated actions influence both the acquired reward and the future knowledge. The optimal policy properly balances exploitation with exploration. The inherent dimensionality\ncurse of decision making under incomplete knowledge prevents the realisation of the optimal design.
Klíčová slova: Adaptive systems; Bayesian estimation; Decision policy; Exploitation; Exploration; Fully probabilistic design; Kullback-Leibler divergence; Markov decision process
Číslo projektu: GA16-09848S (CEP), GA18-15970S (CEP)
Poskytovatel projektu: GA ČR, GA ČR

Instituce: Ústav teorie informace a automatizace AV ČR (web)
Informace o dostupnosti dokumentu: Dokument je dostupný na externích webových stránkách.
Externí umístění souboru: http://library.utia.cas.cz/separaty/2018/AS/karny-0495875.pdf
Původní záznam: http://hdl.handle.net/11104/0288947

Trvalý odkaz NUŠL: http://www.nusl.cz/ntk/nusl-387695


Záznam je zařazen do těchto sbírek:
Věda a výzkum > AV ČR > Ústav teorie informace a automatizace
Zprávy > Výzkumné zprávy
 Záznam vytvořen dne 2018-11-15, naposledy upraven 2019-10-20.


Není přiložen dokument
  • Exportovat ve formátu DC, NUŠL, RIS
  • Sdílet