Název:
Zpětnovazebné učení pro POMDPs s využitím modelů
Překlad názvu:
Model-Based Reinforcement Learning for POMDPs
Autoři:
Smíšková, Lucie ; Andriushchenko, Roman (oponent) ; Češka, Milan (vedoucí práce) Typ dokumentu: Bakalářské práce
Rok:
2024
Jazyk:
eng
Nakladatel: Vysoké učení technické v Brně. Fakulta informačních technologií
Abstrakt: [eng][cze]
Markovské rozhodovací procesy s částečným pozorováním nám umožňují modelovat systémy obsahující stavovou neurčitost. Jsou užitečné, pokud máme pouze částečné informace o stavech (tak zvaná pozorování). Cílem této práce bylo vyvinout metodu kombinující induktivní syntézu a zpětnovazebné učení k vytvoření co nejlepšího konečně stavového kontroléru. Tato metoda poté byla implementována jako rozšíření nástroje PAYNT.
Partially observable Markov decision processes allow us to model systems containing state uncertainty. They are useful when we have only partial information about the states ( so called observations). The aim of this thesis was to develop a method combining inductive synthesis and reinforcement learning to develop the best possible finite-state controller. This method was then implemented as an extension to the tool PAYNT.
Klíčová slova:
Finite State Controller; Partially observable Markov decision processes; recurrent neural network; Reinforcement learning; Synthesis; Konečně stavovový kontroler; Markovské rozhodovací procesy s částečným pozorováním; rekurentní neuronové sítě; syntéza; zpětnovazebné učení
Instituce: Vysoké učení technické v Brně
(web)
Informace o dostupnosti dokumentu:
Plný text je dostupný v Digitální knihovně VUT. Původní záznam: https://hdl.handle.net/11012/247505