|
Using reinforcement learning to learn how to play text-based games
Zelinka, Mikuláš ; Kadlec, Rudolf (vedoucí práce) ; Lisý, Viliam (oponent)
Schopnost naučit se optimálnímu chování v prostředích, kde jsou stavy i akce vyjádřeny v přirozeném jazyce, by se dala aplikovat na řadu skutečných problémů, jako je optimalizace dialogových systémů. Pro tento učící problém jsou vhodnou doménou textové hry s větším počtem možných konců se zpětnou vazbou v podobně číselných ohodnocení. S její pomocí můžeme v tomto kontextu využít technik zpětnovazebního učení pro současné učení vhodné reprezentace textových dat a rozhodovacích pravidel. Představujeme model obecného agenta schopného hrát textové hry a zkoumáme jeho schopnost generalizace a přenosu získaných znalostí na nová prostředí. Rovněž demonstrujeme, že se agent dokáže naučit hrát více textových her najednou. Dále prezentujeme otevřenou knihovnu pyfiction, která sjednocuje přístup k různým textovým hrám a doufáme, že společně s agentem, který je její součástí, by v budoucnu mohla sloužit jako referenční rámec pro podobné úlohy.
|
|
Using Neural Networks to Determine Semantic Similarity of Two Sentences
Hrinčár, Peter ; Kadlec, Rudolf (vedoucí práce) ; Helcl, Jindřich (oponent)
Ur enie stup a sémantickej ekvivalencie dvoch viet je dôleûité pre mnohé praktické aplikácie spracovania prirodzeného jazyka. Cie om je ur i po- dobnos viet na ökále od "vety nemajú ûiaden vzájomn˝ vz ah" aû po "vety sú v˝znamovo ekvivalentné". V práci sme skúmali pouûitie rôznych architektúr ne- urónov˝ch sietí pri rieöení tejto úlohy. Navrhli sme modely pouûívajúce rekurentné siete, ktoré spracujú sekvenciu textu do vektora fixnej dimenzie. alej sme sa za- oberali vhodnou reprezentáciou neznámych slov. Naöe experimenty ukázali, ûe jednoduché architektúry dosiahli lepöie v˝sledky na pouûitom datasete. Budúce rozöírenie práce vidíme v pouûití vä öieho po tu trénovacích dát. 1
|
|
DyBaNeM: Bayesian Model of Episodic Memory
Kadlec, Rudolf ; Brom, Cyril (vedoucí práce) ; Lim, Mei Yii (oponent) ; Pilát, Martin (oponent)
Název práce: DyBaNeM: Bayesovský model epizodické paměti Autor: Mgr. Rudolf Kadlec E-mail: rudolf.kadlec@gmail.com Katedra: Kabinet software a výuky informatiky Vedoucí disertační práce: Mgr. Cyril Brom, Ph.D. Kabinet software a výuky informatiky Abstrakt: Umělí agenti vybavení epizodickou (nebo autobiografickou) pamětí mají schop- nost zapamatovat si a následně si i vybavit, co se jim stalo v minulosti. Stávající modely epizodické paměti (EP) fungují jako pouhé logy s indexy: umožňují záznam, vyhledávání a mazání vzpomínek, ale jen zřídka uchovávají agentovu aktivitu v hierarchické podobě, natož aby umožňovaly automaticky abstraho- vat pozorovanou aktivitu do obecnějších epizod. V důsledku toho nejzajímavější rysy lidské EP, jako jsou rekonstrukce vzpomínek, vznik falešných vzpomínek, postupné zapomínání a předpovídání překvapivých situací, zůstávají mimo jejich dosah. V této práci představíme výpočetní model epizodické paměti pojmenovaný DyBaNeM. DyBaNeM propojuje modelování EP s algoritmy pro rozpoznávání aktivit v jednom výpočetním modelu. DyBaNeM staví na principech Bayesovské statistiky a na takzvané Fuzzy-Trace teorii vycházející z oblasti výzkumu falešných vzpomínek. V práci bude představeno několik...
|
|
Activity recognition in a smart home setting
Fiklík, Vladimír ; Kadlec, Rudolf (vedoucí práce) ; Brom, Cyril (oponent)
Cílem této práce je implementovat a porovnat několik pravděpodobnostních activity recognition algortitmů, které mohou být využity v prostředí smart home a jsou schopny určit aktivitu kterou pozorovaný subject vykonává na základě elementárních pozorování. Takové algoritmy jsou využívány v několika oblastech, například k vylepšení chování virtuálních agentů různého typu. Implementované algoritmy jsou založeny na dynamických Bayesovských sítích a disponují schopnotí určit, zda byla pozorovaná aktivita již dokončena, nebo pouze přerušena. Pro účely sběru dat použitých k učení a testování modelů bylo v rámcio práce připraveno interaktivní 3D prostředí které pokrývá požadavky activity recognition a je snadno rozšiřitelné pro další použití. Data pro učení a testování modelů byla sesbírána pozorováním lidmi ovládaných virtuálních agentů.
|
|
Advanced use of ACT-R in Pogamut
Zemčák, Lukáš ; Kadlec, Rudolf (vedoucí práce) ; Děchtěrenko, Filip (oponent)
Na virtuálnych agentov sú kladené čoraz náročnejšie požiadavky. Pre riadenie komplexného správania sa agenta je možné využiť kognitívne architektúry, ktoré vznikli na rozhraní neurovied a umelej inteligencie. Táto práca sa zaoberá knižnicou PoJACTR, ktorá prepája knižnicu Pogamut pre vývoj inteligentných agentov v hre UT2004. A knižnicu jACT-R, čo je implementácia jednej z popredných kognitívnych architektúr ACT-R v jazyku Java. Práca študuje vybrané problémy implementácie agentov v PoJACTR, navrhuje ako riešenie ladiace nástroje, ktoré boli následne implementované na platforme Eclipse IDE. Okrem toho rozširuje moduly knižnice PoJACTR o navigačný, komunikačný a modul pre hru Capture The Flag. Pre validáciu sa vyvinuli dvaja agenti (boti) hrajúci zmienenú hru, jeden v štandardnom Pogamute a jeden v PoJACTR. Pri súbojoch tímov mal PoJACTR bot porovnateľný výkon ako Pogamut bot. Výsledky ukázali, že ladiace nástroje uľahčili vývoj PoJACTR agentov.
|
|
Uživatelsky přívětivé prostředí pro práci s dynamickými Bayesovskými sítěmi
Vinárek, Jan ; Kadlec, Rudolf (vedoucí práce) ; Skřivánek, Zdeněk (oponent)
Název práce: Uživatelsky přívětivé prostředí pro práci s dynamickými Bayesov- skými sítěmi Autor: Jan Vinárek Ústav: Kabinet software a výuky informatiky Vedoucí bakalářské práce: Mgr. Rudolf Kadlec, Kabinet software a výuky infor- matiky Abstrakt: U open source nástrojů s grafickým rozhraním určených pro datami- ning napsaných v jazyce Java je malá podpora pro zpracování sekvenčních dat. Jedním z nejpopulárnějších modelů využívaných při zpracování sekvenčních dat je dynamická Bayesovská síť, a to s využitím jejích inferenčních algoritmů. Cílem teoretické části práce bylo najít program s grafickým rozhraním pro da- tamining se snadným ovládáním a knihovnu, která dynamické Bayesovské sítě a jejich inferenční algoritmy nejlépe implementuje. Cílem praktické části práce bylo pro zvolený program (RapidMiner) navrhnout a naprogramovat rozšíření s využitím nalezené knihovny (JSMILE). U rozšíření byla otestována kombinace učícího algoritmu Expectation-Maximization a inferenčního algoritmu dynamické Bayesovské sítě pro predikci sekvenčních dat a byla srovnána s použitím učících modelů Support Vector Machines a Decision Tree na dvou příkladech. Klíčová slova: dynamické Bayesovské sítě, sekvenční data, časové řady, Java
|
|
Adaptive Agent in a FPS Game
Witzany, Tomáš ; Kadlec, Rudolf (vedoucí práce) ; Hric, Jan (oponent)
V této práci je navržen a implementován adaptivní protihráč v počítačové hře Unreal Tournament v jejím módu Deathmatch. Agent byl navržen pomocí zpětnovazebního učení a implementován na platformě Pogamut. Pro stavovou abstrakci byl použit clusterovací algoritmus k-means. Dále byl na platformě Pogamut vyvinut framework pro testování výkonu agentů. Tento framework byl použit pro provedení množství experimentů testující různé strategie pro výběr akcí a také byly otestovány různé parametry Q-Learning algoritmu. Výsledné chování má výkon srovnatelný s implementacemi zpětnovazebního učení popsanými v dostupné literatuře.
|
|
Advanced use of ACT-R in Pogamut
Zemčák, Lukáš ; Kadlec, Rudolf (vedoucí práce) ; Pešková, Klára (oponent)
Na virtuálnych agentov sú kladené čoraz náročnejšie požiadavky. Pre riadenie komplexného správania sa agenta je možné využiť kognitívne architektúry, ktoré vznikli na rozhraní neurovied a umelej inteligencie. Táto práca sa zaoberá knižnicou PoJACTR, ktorá prepája knižnicu Pogamut pre vývoj inteligentných agentov v hre UT2004. A knižnicu jACT-R, čo je implementácia jednej z popredných kognitívnych architektúr ACT-R v jazyku Java. Práca študuje vybrané problémy implementácie agentov v PoJACTR, navrhuje ako riešenie ladiace nástroje, ktoré boli následne implementované na platforme Eclipse IDE. Okrem toho rozširuje moduly knižnice PoJACTR o navigačný, komunikačný a modul pre hru Capture The Flag. Pre validáciu sa vyvinuli dvaja agenti (boti) hrajúci zmienenú hru, jeden v štandardnom Pogamute a jeden v PoJACTR. Pri súbojoch tímov mal PoJACTR bot porovnateľný výkon ako Pogamut bot. Výsledky ukázali, že ladiace nástroje uľahčili vývoj PoJACTR agentov. Powered by TCPDF (www.tcpdf.org)
|
|
Coordination of multiple virtual agents in team-based computer games
Kolombo, Martin ; Gemrot, Jakub (vedoucí práce) ; Kadlec, Rudolf (oponent)
Práce se zabývá problémem efektivní koordinace týmu virtuálních agent· v počí- tačových hrách. Hlavním cílem bylo navrhnou obecnou architektru pro práci s informacemi o virtuálním prostředí, která poskytuje programátorovi dobrý přístup k týmovým znalostem o virtuálním prostředí. Zvolená architektura neklade na programátora žádné požadavky ohledně implementace týmu agent· a nezávisí na žádném konkrétním virtuálním prostředí. Architektura je založena na přirozeném rozdělení dat podle jejich schopnosti se měnit v pr·běhu simulace a podle jejich subjektivity. Tato distribuce dat přirozeně vytváří sdílené znalosti týmu a programátorovi tak umožní založit rozhodování agent· na znalostech celého týmu namísto pouze jediného agenta. Architekturu jsme implemento- vali do systému Pogamut, ve kterém jsme provedli validaci zpětné kompati- bility. Vzheldem k nekompatibilitě formátu dat exportovaných součástí Poga- mutu, který jsme objevili v poslední fázi validace jsme provedli validaci pouze částečnou. Úpravu platformy Pogamut a následnou implementaci týmu agent· využívajícího naši architekturu plánujeme jako pokračování práce. 1
|
|
Episodická paměť s věrohodným zapomínáním
Soukup, Tomáš ; Brom, Cyril (vedoucí práce) ; Kadlec, Rudolf (oponent)
Název práce: Episodická paměť s věrohodným zapomínáním Autor: Tomáš Soukup Katedra (ústav): Kabinet software a výuky informatiky Vedoucí bakalářské práce: Mgr. Cyril Brom, Ph.D., KSVI Abstrakt: Předložená bakalářská práce představuje model episodické paměti pro virtuální bytosti rozšířený o věrohodné zapomínání na základě ohodnocení vzpomínek podle jejich důležitosti. Inspiruje se psychologickým modelem E. Tulvinga a experimenty W. A. Wagenaara a M. Lintonové a staví na modelu paměti pro animata vyvinutém Klárou Peškovou, který dále upravuje pro potřeby zapomínání. Využívá tzv. "level-of-detail" přístup pro postupné zapomínání částí vzpomínek. Při ohodnocování vzpomínek zohledňuje kromě jejich stáří a detailnosti i jejich emotivnost. Za tímto účelem vytváří i jednoduchý model emocí. Funkčnost modelu ověřuje v prototypové aplikaci, ve které simuluje život virtuální bytosti ve virtuálním světě. Pomocí experimentů ukazuje, že při vhodné parametrizaci chování modelu odpovídá představám psychologů. Klíčová slova: episodická paměť, zapomínání, virtuální člověk, emoce, uvěřitelnost
|