National Repository of Grey Literature 11 records found  1 - 10next  jump to record: Search took 0.01 seconds. 
Aplikace posilovaného učení v řízení Smart Home
Biel, Gabriel ; Zbořil, František (referee) ; Janoušek, Vladimír (advisor)
Táto práca skúma, ako môže strojové učenie zlepšiť riadenie inteligentných domácností s dôrazom na optimalizáciu riadenia teploty a zvýšenie energetickej účinnosti. Konkrétne sa porovnávajú dva pokročilé algoritmy posilňovaného učenia, Deep Q-Learning (DQL) a Proximal Policy Optimization (PPO). Tieto modely sú testované v simulovanom prostredí, ktoré napodobňuje reálne podmienky, aby sa zhodnotila ich schopnosť prispôsobiť sa správaniam užívateľov a zmenám v prostredí. Ukázalo sa, že model PPO je obzvlášť účinný vďaka svojej stabilite a schopnosti predpovedať návrat obyvateľov. Tento výskum ponúka cenné poznatky o praktických aplikáciách AI technológií v inteligentných domácnostiach.
Heuristics for the Scotland Yard Board Game
Cejpek, Michal ; Zbořil, František (referee) ; Zbořil, František (advisor)
This thesis explores the possibility of using deep and reinforcement learning algorithms to solve problems with incomplete information. The main algorithm under investigation is PPO – Proximal Policy Optimization. In order to test the suitability of the PPO algorithm, a simplified implementation of the Scotland Yard game was created as well as an environment for training and testing the algorithms. From performed experiments, it emerged that the PPO algorithm is very suitable for solving problems with incomplete information. The agents very quickly gained a sense of the game’s goals and built appropriate strategies to meet those goals through training.
Using Reinforcement learning and inductive synthesis for designing robust controllers in POMDPs
Hudák, David ; Holík, Lukáš (referee) ; Češka, Milan (advisor)
Jednou ze současných výzev při sekvenční rozhodováním je práce s neurčitostí, která je způsobena nepřesnými senzory či neúplnou informací o prostředích, ve kterých bychom chtěli dělat rozhodnutí. Tato neurčitost je formálně popsána takzvanými částečně pozorovatelnými Markovskými rozhodovacími procesy (POMDP), které oproti Markovským rozhodovacím procesům (MDP) nahrazují informaci o konkrétním stavu nepřesným pozorováním. Pro rozhodování v takových prostředích je nutno nějakým způsobem odhadovat současný stav a obecně tvorba optimálních politik v takových prostředích není rozhodnutelná. K vyrovnání se s touto výzvou existují dva zcela odlišné přístupy, kdy lze k problému přistupovat úplnými formálními metodami, a to buď s pomocí výpočtu beliefů či syntézou konečně stavových kontrolérů, nebo metodami založenými na nepřesné aproximaci současného stavu, reprezentované především hlubokým zpětnovazebným učením. Zatímco formální přístupy jsou schopné dělat verifikovatelná a robustní rozhodnutí pro malá prostředí, tak zpětnovazebné učení je schopné škálovat na reálné problémy. Tato práce se pak soustředí na spojení těchto dvou odlišných přístupů, kdy navrhuje různé metody jak pro interpretaci výsledku, tak pro vzájemné předávání nápověd. Experimenty v této práci ukazují, že z této symbiózy mohou těžit oba přístupy, ale také že zvolený přístup ke trénování agentů už sám o sobě řádově překonává současné systémy pro trénování agentů na podobných úlohách.
Vehicle Control via Reinforcement Learning
Maslowski, Petr ; Uhlíř, Václav (referee) ; Šůstek, Martin (advisor)
The goal of this thesis is a creation of an autonomous agent that can control a vehicle. The agent utilizes reinforcement learning that uses neural networks. The agent interprets images from the front vehicle camera and selects appropriate actions to control the vehicle. I designed and created reward functions and then experimented with hyperparameters setup. Trained agent simulate driving on the road. The result of this thesis shows a possible approach to control an autonomous vehicle agent using machine learning method in CARLA simulator.
Deep Neural Networks for Reinforcement Learning
Ludvík, Tomáš ; Bambušek, Daniel (referee) ; Hradiš, Michal (advisor)
The aim of this thesis is to use deep neural networks for task in reinforcement learning. I use my modification of 2D game Tuxánci for the purposes of the test environment. This modification provides the possibility of using the game as an environment for machine learning. Subsequently, Iam solving the task of learning the agent by using reinforcement learning with the Double DQN algorithm.
Shared Experience in Reinforcement Learning
Mojžíš, Radek ; Šůstek, Martin (referee) ; Hradiš, Michal (advisor)
The aim of this thesis is to use methods of transfer learning for training neural network on a reinforcement learning tasks. As test environment, I am  using old 2D console games, such as space invaders or phoenix. I am testing the impact of re-purposing already trained models for different environments. Next I use methods for domain feature transfer. Lastly i focus on the topic of multi-task learning. From the results we can gain insight into possibilities of using transfer learning for reinforcement learning algorithms.
Deep Learning Methods for Machine Playing the Scotland Yard Board Game
Hrkľová, Zuzana ; Janoušek, Vladimír (referee) ; Zbořil, František (advisor)
Táto práca sa zaoberá metódami hlbokého učenia, ktoré sú aplikovateľné na stolné hry s neurčitosťou. V rámci práce boli naštudované princípy učenia s posilňovaním, s hlavným zameraním na Q-learning algoritmy, spomedzi ktorých bol vybraný Deep Q-Network algoritmus. Ten bol následne implementovaný na zjednodušených pravidlách stolnej hry Scotland Yard. Konečná implementácia bola porovnaná s metódami Alpha-Beta a Monte Carlo Tree Search. S výsledkov vyplinulo, že schovávaný hráč riadený DQN algoritmom predstavoval pre ostatné metódy najťažšieho protihráča, narozdiel od hľadajúcich hráčov, ktorým sa nepodarilo zlepšiť existujúce riešenia. Napriek tomu, že implementovaná metóda nedosiahla lepšie výsledky oproti doposiaľ existujúcim metódam, ukázalo sa, že potrebuje najmenej výpočetných zdrojov a času na vykonanie daného ťahu. To ju robí najperspektívnejšou zo spomínaných metód na budúcu možnú implementáciu originálnej verzie danej hry.
Deep Neural Networks for Reinforcement Learning
Ludvík, Tomáš ; Bambušek, Daniel (referee) ; Hradiš, Michal (advisor)
The aim of this thesis is to use deep neural networks for task in reinforcement learning. I use my modification of 2D game Tuxánci for the purposes of the test environment. This modification provides the possibility of using the game as an environment for machine learning. Subsequently, Iam solving the task of learning the agent by using reinforcement learning with the Double DQN algorithm.
Shared Experience in Reinforcement Learning
Mojžíš, Radek ; Šůstek, Martin (referee) ; Hradiš, Michal (advisor)
The aim of this thesis is to use methods of transfer learning for training neural network on a reinforcement learning tasks. As test environment, I am  using old 2D console games, such as space invaders or phoenix. I am testing the impact of re-purposing already trained models for different environments. Next I use methods for domain feature transfer. Lastly i focus on the topic of multi-task learning. From the results we can gain insight into possibilities of using transfer learning for reinforcement learning algorithms.
Vehicle Control via Reinforcement Learning
Maslowski, Petr ; Uhlíř, Václav (referee) ; Šůstek, Martin (advisor)
The goal of this thesis is a creation of an autonomous agent that can control a vehicle. The agent utilizes reinforcement learning that uses neural networks. The agent interprets images from the front vehicle camera and selects appropriate actions to control the vehicle. I designed and created reward functions and then experimented with hyperparameters setup. Trained agent simulate driving on the road. The result of this thesis shows a possible approach to control an autonomous vehicle agent using machine learning method in CARLA simulator.

National Repository of Grey Literature : 11 records found   1 - 10next  jump to record:
Interested in being notified about new results for this query?
Subscribe to the RSS feed.