Národní úložiště šedé literatury Nalezeno 32 záznamů.  předchozí3 - 12dalšíkonec  přejít na záznam: Hledání trvalo 0.01 vteřin. 
Porovnání přístupů ke generování umělých dat
Šejvlová, Ludmila ; Šimůnek, Milan (vedoucí práce) ; Pavlíčková, Jarmila (oponent)
Diplomová práce se zabývá umělými daty, konkrétně vybranými přístupy k jejich generování a praktickou úlohou generování dat. Cílem teoretické části práce je popsat vybrané přístupy ke generování umělých dat, shrnout jejich hlavní klady a zápory a jednotlivé přístupy vůči sobě porovnat. Cílem praktické části práce je vygenerovat umělá data pro účely výuky dobývání znalostí z databází. Práce uvádí základní popis umělých dat a podrobně vysvětluje proces jejich generování. Z možných přístupů ke generování umělých dat se práce zaměřuje na náhodný přístup, statistický přístup, generovací jazyky a nástroj ReverseMiner. Práce pojednává také o využití umělých dat v praxi a o vhodnosti jednotlivých přístupů pro určité záměry. V rámci práce byla pomocí nástroje ReverseMiner vytvořena výuková data Hotel SD, která obsahují vztahy odhalitelné pomocí GUHA-procedur typu SD (set-difference).
Míry podobnosti pro nominální data v hierarchickém shlukování
Šulc, Zdeněk ; Řezanková, Hana (vedoucí práce) ; Šimůnek, Milan (oponent) ; Žambochová, Marta (oponent)
Tato disertační práce se zabývá mírami podobnosti pro nominální data v hierarchickém shlukování, které umožňují zacházet s proměnnými s více než dvěma kategoriemi a které si kladou za cíl nahradit postupy založené na koeficientu prosté shody, které se v této oblasti běžně používají. Tyto míry podobnosti uvažují dodatečné informace ohledně datového souboru, jako je rozdělení četností kategorií u dané proměnné nebo počet jejích kategorií. Tato práce se věnuje třem hlavním cílům. Prvním cílem je prozkoumání a ohodnocení kvality shlukování vybraných měr podobnosti pro hierarchické shlukování objektů a proměnných. K dosažení tohoto cíle bylo provedeno několik experimentů, které se zabývají jak shlukováním objektů, tak proměnných. Tyto experimenty zkoumají kvalitu shluků vytvořených za pomocí zkoumaných měr podobnosti pro nominální data ve srovnání běžně používanými mírami podobnostmi využívajícími binární transformaci a dále s několika alternativními metodami pro shlukování nominálních dat. Toto porovnání je provedeno na reálných i generovaných souborech. Výstupy těchto experimentů vedou ke zjištění, které míry podobnosti jsou vhodné k obecnému použití, které podávají dobré výsledky v konktrétních situacích a které nejsou doporučeny pro shlukování objektů nebo proměnných. Druhým cílem práce je navržení míry podobnosti vycházející z teoretických předpokladů a její následné porovnání s ostatními zkoumanými mírami podobnosti. Na základě tohoto cíle byly představeny dvě nové míry podobnosti, Variable Entropy a Variable Mutability. Obzvláště prvně zmíněná míra podává velmi dobré výsledky u souborů s nižším počtem proměnných. Třetím cílem této práce je poskytnout komfortní sofwarové řešení založené na zkoumaných mírách podobnosti pro nominální data, které pokrývá celý proces shlukování od výpočtu matice vzdálenosti po hodnocení výsledných shluků. Tento cíl byl dosažen vytvořením balíčku nomclust pro program R, který řeší tuto problematiku a který je volně dostupný.
Analýza reálných dat pro úsek zákaznických služeb
Maximilián, Michal ; Šimůnek, Milan (vedoucí práce) ; Veselý, Jiří (oponent)
Cílem této bakalářské práce je pomocí analýzy reálných CRM dat nalézt takové vztahy, které by zadavatelská společnost využila k upřesnění návrhu obsahu nových webových stránek. Tato analýza bude prováděna pomocí procedur CF-Miner a KL-Miner systému LISp-Miner, který je akademickým systémem pro dobývání znalostí z databází založený na metodě GUHA. Celý proces analýzy je rozdělen dle fází metodiky CRISP-DM. Přínosem mé práce je především nalezení neznámých vztahů a závislostí, které budou v praxi efektivně využity. Dalším přínosem je představení metod a nástrojů, využitých při analýze a v neposlední řadě také představení samotného systému LISp-Miner. Práce je rozdělena na teoretickou a praktickou část. V prvních třech kapitolách vysvětlím, co je to dobývání znalostí z databází, jaké se při něm používají nástroje, metodiky a postupy. Dále vysvětlím jednotlivé fáze DZD odpovídající metodice CRISP-DM. Závěrem teoretické části popíši systém LISp-Miner, který byl pro tuto analýzu využit. Praktická část je členěna dle metodiky CRISP-MD. Představím tedy nejprve oblast a data, která budu analyzovat. V dalších krocích si data předpřipravím a následně je využiji při řešení analytických úloh. V závěru praktické části interpretuji výsledky jednotlivých analýz a navrhnu využití v praxi.
Možnosti prezentace výsledků DZD na webu
Koválik, Tomáš ; Rauch, Jan (vedoucí práce) ; Šimůnek, Milan (oponent)
Diplomová práce se zabývá DZD analýzou dat a způsoby prezentace výsledků DZD na webu. Práce je členěna do tří hlavních částí, které na sebe navazují a kopírují průběh celé práce. První část práce obsahuje teoretický základ, potřebný pro pochopení probírané problematiky. Je zde popsána metodika CRISP-DM, jsou zde definovány pojmy matice dat a doménové znalosti, je zde představena metoda GUHA, systém LISp-Miner a implementace metody GUHA v systému LISp-Miner včetně popis pro tuto práci stěžejních procedur 4ft-Miner a CF-Miner. Druhá část práce je zaměřená na zpracování prvního cíle práce. Stručně se věnuje popisu provedené preanalýzy a následně je zde popsán postup během analýzy doménových znalostí ve vybrané datové sadě. V třetí části práce je následně řešen druhý cíl práce, problém prezentace výsledků DZD na webu. Třetí část práce obsahuje stručný teoretický základ k vybraným technologiím. Následně je zde popsána práce při tvorbě automatického exportu výsledků DZD do formátu HTML včetně struktury výstupu a doporučení pro práci se systémem LISp-Miner.
Analýza reálných dat z restauračního prostředí
Šimeček, Petr ; Rauch, Jan (vedoucí práce) ; Šimůnek, Milan (oponent)
Cílem této diplomové práce je provést analýzu reálných dat z restauračního prostředí v centru Prahy, ověřit předpoklady založené na stávajících znalostech a prozkoumat skryté vztahy. K prvotní transformaci originální struktury dat byl využit databázový systém MySQL. Pomocí něj byla data převedena do podoby, se kterou bylo možné manipulovat pomocí procedury LMDataSource systému LISp-Miner. K analýzám asociačních vztahů byla využita procedura 4ft-Miner systému LISp-Miner. V frekvenčních analýzách byl využit databázový systém MySQL pro získání výsledků a Microsoft Word a Excel pro interpretaci výsledků. Na některé z předpokladů se podařilo na základě objevených skutečností přesvědčivě odpovědět. Dále se podařilo získat zajímavé kombinace vztahů. Výstup této práce umožňuje majiteli dat využít některé z výsledků analýz pro optimalizaci vnitrofiremních procesů. Dále tato práce poukazuje na další možné směry analýz těchto dat.
Využití systému LISp-Miner při analýze faktorů ovlivňujících dominanci sinic ve fytoplanktonu
Hlaváčová, Tereza ; Šimůnek, Milan (vedoucí práce) ; Potužák, Jan (oponent)
Tématem práce jsou kroky spojené s řešením analytické otázky pomocí systému LISp-Miner v datech získaných z rozborů vod 12 rybníků v jižních Čechách v letech 2007 až 2012. Analytické otázky jsou primárně zaměřeny z pokynu zadavatele, Povodí Vltavy, státní podnik, na problematiku sinic. Mimo popisu postupu při aplikaci procedur KL-Miner, CF-Miner a 4ft-Miner na data, si práce klade za cíl připravit postup pro automatizaci prováděných kroků. Obsahem teoretické části je shrnutí základních pojmů a principů spojených s asociačními pravidly a metodou GUHA. Praktická část postupuje podle metodologie CRISP-DM. Výsledkem práce je návrh automatizace postupu, podle kterého je možné hledat zajímavá pravidla v hydrobiologických a hydrochemických datech. Dále je uveden soubor doporučení pro lepší využitelnost databáze zadavatele pro potřeby DZD, s návrhy na úpravu dat.
Analýza dát z oblasti kontroly kvality použitím systému LISp-Miner
Štefke, Martin ; Šimůnek, Milan (vedoucí práce) ; Srogoňová, Kristína (oponent)
Předmětem bakalářské práce je analýza vzniku neshodných výrobků v společnosti SEWS Slovakia. Analyzované byli záznamy o vzniku neshodných výrobků z období 2013 až 10/2014, analýza bola vykonaná z databáze v akademickém systéme LISp-Miner. V úvodní teoretické části je shrnutí různých přístupů k problematice dobývání znalostí z databází. V následující praktické časti práce je uvedený postup úpravy a zpracování dat, definic základních analytických otázek. V závěru jsou definované relevantní vztahy mezi datami a analytickými metodami.
Propojení OLAPu a data miningu při analýze cvičného datasetu
Borokshinova, Anastasia ; Chudán, David (vedoucí práce) ; Šimůnek, Milan (oponent)
Cílem této práce je ukázat možnost propojení dvou technik datové analýzy OLAP a data mining v určité oblasti. Základním způsobem dosažení cíle bude průběžné porovnávání a kontrola získaných výsledků pomocí již zmíněných technik. Pro praktickou aplikaci daného způsobu je použit cvičný dataset o úvěrech poskytnutých fyzickým osobám. Analýza dat bude prováděna pomocí doplňku MS Excelu Power Pivot a systému LISp-Miner. Při práci s LISp-Minerem bude využita konkrétně procedura 4ft-Miner, která postupuje podle uznávané data miningové metodiky CRISP-DM. Přínos práce spočívá především v představení možností propojení OLAP a data miningu na stejném datasetu, a tím omezení počtu možných mylných závěrů, ke kterým by analytici mohli dospět pouze na základě jedné z technik. Dalšími přínosy je ukázka převedení relačních dat do multidimenzionální struktury a praktické možnosti využití procedury 4ft-Miner systému LISp-Miner.
Automatizace předzpracování dat za využití doménových znalosti
Beskyba, Jan ; Šimůnek, Milan (vedoucí práce) ; Pejčoch, David (oponent)
V této práci se snažíme navrhnout řešení, které by přispělo k automatizaci celého procesu dobývání znalostí z databází. Důležitou roli v procesu automatizace mají doménové znalosti, které je nutné zahrnout do zde navrženého programu pro přípravu dat. V úvodu této práce se zaměříme na teoretická východiska dobývání informací z databází s důrazem na doménové znalosti. Dále se zaměříme na základní principy předzpracování dat a na skriptovací jazyk LMCL, který bude využit při implementaci aplikace určené pro automatickou přípravu dat. Následně se budeme věnovat návrhu samotné aplikace. Dle návrhu budou vybrané části aplikace implementovány a následně ověřeny na datech Poslanecké sněmovny.
Automation of a data mining process by the LISp-Miner system
Ochodnická, Zuzana ; Šimůnek, Milan (vedoucí práce) ; Rauch, Jan (oponent)
Tato práce je zaměřená na oblast automatického data miningu. Její cíl je popsat oblast automatického data mining-u, vytvořit návrh procesu automatického vytváření data miningových úloh pro verifikaci zadaných doménových znalostí a pro hledání nových znalostí a také implementace verifikace zadaných doménových znalostí s typem závislosti influence a přizpůsobováním prohledávacího prostoru. Jazyk implementace je LMCL, který umožňuje použití funkcionality systému LISp-Miner automatizovaným způsobem. Pro tyto analýzy dat byla použita data z monitorování znečištění ovzduší. Návrh i implementace byly úspěšné a vytvořené skripty by mohly být použité (s manuálními změnami vstupních parametrů) i pro analýzu dalších dat.

Národní úložiště šedé literatury : Nalezeno 32 záznamů.   předchozí3 - 12dalšíkonec  přejít na záznam:
Viz též: podobná jména autorů
8 Šimunek, Martin
8 Šimůnek, Martin
2 Šimůnek, Michal
8 Šimůnek, Michal V.
2 Šimůnek, Miroslav
Chcete být upozorněni, pokud se objeví nové záznamy odpovídající tomuto dotazu?
Přihlásit se k odběru RSS.