Original title:
Zpětnovazebné učení pro POMDPs s využitím modelů
Translated title:
Model-Based Reinforcement Learning for POMDPs
Authors:
Smíšková, Lucie ; Andriushchenko, Roman (referee) ; Češka, Milan (advisor) Document type: Bachelor's theses
Year:
2024
Language:
eng Publisher:
Vysoké učení technické v Brně. Fakulta informačních technologií Abstract:
[eng][cze]
Markovské rozhodovací procesy s částečným pozorováním nám umožňují modelovat systémy obsahující stavovou neurčitost. Jsou užitečné, pokud máme pouze částečné informace o stavech (tak zvaná pozorování). Cílem této práce bylo vyvinout metodu kombinující induktivní syntézu a zpětnovazebné učení k vytvoření co nejlepšího konečně stavového kontroléru. Tato metoda poté byla implementována jako rozšíření nástroje PAYNT.
Partially observable Markov decision processes allow us to model systems containing state uncertainty. They are useful when we have only partial information about the states ( so called observations). The aim of this thesis was to develop a method combining inductive synthesis and reinforcement learning to develop the best possible finite-state controller. This method was then implemented as an extension to the tool PAYNT.
Keywords:
Konečně stavovový kontroler; Markovské rozhodovací procesy s částečným pozorováním; rekurentní neuronové sítě; syntéza; zpětnovazebné učení; Finite State Controller; Partially observable Markov decision processes; recurrent neural network; Reinforcement learning; Synthesis
Institution: Brno University of Technology
(web)
Document availability information: Fulltext is available in the Brno University of Technology Digital Library. Original record: https://hdl.handle.net/11012/247505