Národní úložiště šedé literatury Nalezeno 55 záznamů.  začátekpředchozí21 - 30dalšíkonec  přejít na záznam: Hledání trvalo 0.00 vteřin. 
Data mining v datech z finanční instituce
Fedorko, Michal ; Rauch, Jan (vedoucí práce) ; Kotlář, Ondřej (oponent)
Cílem této práce je vytvořit dataminingovou analýzu dobrovolných odchodů z finanční instituce působící na trhu v České republice. Na základě dat skladovaných HR oddělením. Vstupem byla pouze tvrdá data, která personální oddělení momentálně eviduje.K řešení byla použita metodika CRISP-DM a pro samotné modelování program LISp-Miner. Analýza se opírá zejména o asociační pravidla. Bylo nalezeno několik zajímavých vztahů, které byly dále analyzovány a interpretovány. Výsledky práce umožňují instituci upravit řízení interních kampaní a otevírá cestu k predikčním modelům, které má instituce v zájmu implementovat.
Data mining ve veřejně přístupných datech
Pangrác, Jiří ; Rauch, Jan (vedoucí práce) ; Chudán, David (oponent)
Tato bakalářská práce se zabývá aplikací metod dataminingu na veřejně přístupná data. Datamining je technika získávání potenciálně zajímavých vztahů z dat. Analýza je prováděna na datech České obchodní inspekce, která jsou veřejně dostupná. Byly položeny analytické otázky, na které v této práci hledám odpovědi. Pro řešení analytických otázek je používán systém LISp-Miner, konkrétně procedury 4ft-Miner a CF-Miner. Kromě samotných otázek se práce zabývá i systémem LISp-Miner a dataminingem obecně. Hlavním cílem práce je prezentace výsledků pro jejich případné použití v praxi.
Vytvoření predikčního modelu předpovědi počasí pomocí neuronové sítě a asociačních pravidel
Kadlec, Jakub ; Rauch, Jan (vedoucí práce) ; Berka, Petr (oponent)
Tato diplomová práce představuje tři různé způsoby výběru vhodných prediktorů pro konstrukci binárního klasifikátoru za účelem automatizované předpovědi počasí s využitím asociačních pravidel a kontingenční analýzy v systém LISp-Miner. První část práce se skládá ze sbírky teoretických znalostí, které přímo souvisí s vytvořením prediktivního modelu, zatímco druhá část popisuje tvorbu modelu jako takového pomocí metodiky CRISP-DM. Závěrečná část práce je věnována analýze výkonu vytvořených neuronových sítí a porovnání jednotlivých metod.
Možnosti prezentace výsledků DZD na webu
Koválik, Tomáš ; Rauch, Jan (vedoucí práce) ; Šimůnek, Milan (oponent)
Diplomová práce se zabývá DZD analýzou dat a způsoby prezentace výsledků DZD na webu. Práce je členěna do tří hlavních částí, které na sebe navazují a kopírují průběh celé práce. První část práce obsahuje teoretický základ, potřebný pro pochopení probírané problematiky. Je zde popsána metodika CRISP-DM, jsou zde definovány pojmy matice dat a doménové znalosti, je zde představena metoda GUHA, systém LISp-Miner a implementace metody GUHA v systému LISp-Miner včetně popis pro tuto práci stěžejních procedur 4ft-Miner a CF-Miner. Druhá část práce je zaměřená na zpracování prvního cíle práce. Stručně se věnuje popisu provedené preanalýzy a následně je zde popsán postup během analýzy doménových znalostí ve vybrané datové sadě. V třetí části práce je následně řešen druhý cíl práce, problém prezentace výsledků DZD na webu. Třetí část práce obsahuje stručný teoretický základ k vybraným technologiím. Následně je zde popsána práce při tvorbě automatického exportu výsledků DZD do formátu HTML včetně struktury výstupu a doporučení pro práci se systémem LISp-Miner.
Automatizace dataminingového procesu v datech o dopravních nehodách v Londýně
Soukup, Tomáš ; Rauch, Jan (vedoucí práce) ; Vojíř, Stanislav (oponent)
Tématem práce je oblast automatizovaného data miningu a kroky spojené s řešením analytických otázek pomocí systému LISp-Miner v datech se záznamy o dopravních nehodách. Analytické otázky byly vytvářeny na základě doménových znalostí získaných ze statistik dopravních nehod ve Velké Británii a z předchozí analýzy provedené během mé semestrální práce. Hlavním cílem je vytvořit návrh automatizovaného procesu, který provede analýzu vstupních dat použitím procedur 4ft-Miner, Ac4ft-Miner a SD4ft-Miner, a jeho prostřednictvím vyhledat nové znalosti pro každý rok sledovaného období. Jazykem implementace je LMCL, který umožňuje použití funkcionality systému LISp-Miner automatizovaným způsobem. Vytvořené skripty je možné použít pro analýzu dat se stejnou strukturou, anebo po jejich manuální úpravě pro data zcela odlišná.
Aplikace metod DZD na otevřená data
Prokůpek, Miroslav ; Rauch, Jan (vedoucí práce) ; Chudán, David (oponent)
Práce se věnuje aplikaci metod DZD na otevřená data. Je realizována řešením analytických otázek za pomoci systému LISp-Miner. Otázky jsou pokládány na data z České obchodní inspekce z pohledu majitele dat. Použitou procedurou k vyřešení analytických otázek je 4ft-Miner. Byly prezentovány a vyřešeny 4 analytické otázky, které jsou výsledky práce. Práce obsahuje podrobný popis transformace relační databáze do formátu vhodného k těžení a podrobný popis dat. Teoretická část práce se zabývá metodou GUHA a metodikou CRISP-DM.
Komplexní řízení kvality dat a informací
Pejčoch, David ; Rauch, Jan (vedoucí práce) ; Máša, Petr (oponent) ; Novotný, Ota (oponent) ; Kordík, Pavel (oponent)
Tato práce pojednává o problematice kvality dat a informací. Kriticky hodnotí současný stav poznání v oblasti jednotlivých metod používaných pro audit a zvyšování kvality dat (resp. informací) a navrhuje nové principy tam, kde toto zhodnocení odhalilo mezery. Hlavní myšlenkou této práce je koncept řízení kvality dat a informací napříč celým univerzem dat. Toto univerzum představují všechny datové zdroje, se kterými přichází dany subjekt do styku, a které jsou používány v rámci jeho stávajících nebo zamýšlených procesů. Pro všechny tyto zdroje uvažuji nastavení shodné sady pravidel, politik a principů vycházejících ze současných a potenciálních přínosů těchto zdrojů při současném zohlednění případných rizik jejich užití. Jakousi pomyslnou červenou nití, která se táhne celým textem, je důležitost dodatečných znalostí pro proces řízení kvality dat / informací. Zavedení znalostní báze orientované na podporu řízení kvality dat a informací (QKB) je proto jedním ze základních principů autorem navržené sady doporučených postupů CADAQUES, které představují sumarizaci dílčích závěrů jednotlivých kapitol této práce.
Analýza reálných dat z restauračního prostředí
Šimeček, Petr ; Rauch, Jan (vedoucí práce) ; Šimůnek, Milan (oponent)
Cílem této diplomové práce je provést analýzu reálných dat z restauračního prostředí v centru Prahy, ověřit předpoklady založené na stávajících znalostech a prozkoumat skryté vztahy. K prvotní transformaci originální struktury dat byl využit databázový systém MySQL. Pomocí něj byla data převedena do podoby, se kterou bylo možné manipulovat pomocí procedury LMDataSource systému LISp-Miner. K analýzám asociačních vztahů byla využita procedura 4ft-Miner systému LISp-Miner. V frekvenčních analýzách byl využit databázový systém MySQL pro získání výsledků a Microsoft Word a Excel pro interpretaci výsledků. Na některé z předpokladů se podařilo na základě objevených skutečností přesvědčivě odpovědět. Dále se podařilo získat zajímavé kombinace vztahů. Výstup této práce umožňuje majiteli dat využít některé z výsledků analýz pro optimalizaci vnitrofiremních procesů. Dále tato práce poukazuje na další možné směry analýz těchto dat.
Analýza dat týkajících se risku sebevraždy u mentálně nemocných
Hron, Jiří ; Rauch, Jan (vedoucí práce) ; Malá, Ivana (oponent)
Cíle této práce jsou poskytnutí uceleného přehledu poznatků o sebevraždách jak mezi obecnou populací, tak specificky mezi mentálně postiženými pacienty, analýza záznamů o hospitalizacích mentálně postižených pacientů mezi lety 2006 a 2008 s důrazem na nalezení potencionálních rizikových faktorů sebevraždy nebo informací vhodných pro predikci pravděpodobnosti sebevraždy v době propuštění z lékařského zařízení, a konečně porovnání vybraných statistických metod v kontrastu k metodám strojového učení a dobývání znalostí z databází ve vztahu k předchozímu úkolu. Přehled je založen na poznatcíh z více jak 40 odborných článků. Analýza a porovnání metod využívá metod pro těžení asociativních pravidel, vizuálních a krokových metod pro exploraci dat, logistické a podmíněné logistické regrese pro analytickou část, a tzv. textit{random forest} modelu pro predikci. Autor si není vědom existence jakékoliv práce na témata stanovená pro tuto tezi vypracované na území České republiky, přičemž tato témata jistě nikdy nebyla zkoumána nad datovým souborem poskytnutým pro účely této teze. Dalším původním přínosem autora je krátký popis a otestování nové verze učícího algoritmu založená na kombinaci textit{random forest} a setu logistických regresních modelů použitých pro zpřesnění odhadů produkovaných prvním z modelů. Struktura sleduje výše uvedené cíle začínaje od kapitol o poznatcích předchozího výzkumu a o teoretických základech použitých metod a konče vlastní analýzou a interpretací výsledků.
Srovnání vybraných nástrojů dobývání znalostí z databází z hlediska implementace asociačních pravidel
Lízler, Robert ; Nekvapil, Viktor (vedoucí práce) ; Rauch, Jan (oponent)
Tato bakalářská práce se zabývá srovnáním dvou data miningových softwarových nástrojů, LISp-Mineru, vyvíjeného na katedře informačního a znalostního inženýrství Fakulty informatiky a statistiky VŠE a Rapidmineru, celosvětově populární softwarové sady. Srovnání je zaměřeno na vyhledávání asociačních pravidel. Cílem práce je zaprvé poskytnout uživatelsky zaměřené zhodnocení jak si tyto softwarové nástroje vzájemně stojí ve zvolené problematice a zadruhé se pokusit najít nějaké zajímavé rozdíly mezi výsledky toho, jak implementují procedury hledání asociačních pravidel. Těchto cílů bude dosaženo otestováním a zhodnocením na základě zvolených kritérií, která spadají do tří kategorií: funkčnost, uživatelské pohodlí a výkon/výsledky praktických úloh. Struktura práce je následující: prvá kapitola se zabývá nutným teoretickým zázemím a představuje dané softwarové nástroje, druhá kapitola hodnotí nabízené funkce pro různé kroky procesu hledání asociačních pravidel, třetí kapitola hodnotí softwarové nástroje z hlediska použitelnosti a uživatelského pohodlí a čtvrtá kapitola shrnuje výsledky testování softwarových nástrojů na zvolené datové sadě.

Národní úložiště šedé literatury : Nalezeno 55 záznamů.   začátekpředchozí21 - 30dalšíkonec  přejít na záznam:
Chcete být upozorněni, pokud se objeví nové záznamy odpovídající tomuto dotazu?
Přihlásit se k odběru RSS.