keywords:"data mining" - Výsledky hledání - Digitální repozitář

host :: přihlásit Digitální repozitář
		Hledej		Nový záznam		Nápověda		O repozitáři

Hlavní stránka > Výsledky hledání: keywords:"data mining"

Hledej:



Tipy pro vyhledávaní :: Jednoduché hledání

Hledej ve sbírkách:

Seřadit podle:	Zobrazit výsledky:	Výstupní formát:

	Praktické uplatnění technologií data mining ve zdravotních pojišťovnách Kulhavý, Lukáš ; Pour, Jan (vedoucí práce) ; Kučera, Petr (oponent) Tato diplomová práce se věnuje technologii data mining a možnostem jejího praktického využití v oblasti zdravotních pojišťoven. Práce vymezuje pojem data mining a jeho vztah k pojmu dobývání znalostí z databází. Pojem data mining je vysvětlen mimo jiné pomocí metodik popisujících jednotlivé fáze procesu dobývání znalostí z databází (CRISP-DM, SEMMA). Nechybí informace o možných praktických využitích technologie a o dostupných produktech na trhu (jak produkty zdarma dostupné, tak produkty komerční). Představení hlavních metod data miningu a konkrétních algoritmů (rozhodovací stromy, asociační pravidla, neuronové sítě a další metody) slouží jako teoretický úvod, na který navazují praktické aplikace nad reálnými daty reálných zdravotních pojišťoven. Jedná se o aplikace hledání příčin nárůstu úhrad a predikce odchodu zákazníků. Tyto aplikace jsem řešil ve zdarma dostupných systémech Weka a LISp-Miner. Cílem je představit a ověřit schopnosti data miningu nad daty tohoto typu a ověřit možnosti zmíněných systémů Weka a LISp-Miner při řešení úloh vzhledem k metodice CRISP-DM. Závěr práce je věnován oblastem cloud a grid computingu ve spojitosti s data miningem. Nabízí pohled na možnosti těchto technologií a jejich přínosy pro technologii data mining. Možnosti využití cloud computingu jsou prezentovány na řešení Amazon EC2, grid computing je možné využít z rozhraní Weka Experimenter. Úplný záznam
	Aplikace data miningu v marketingu Ďurkovský, Jaroslav ; Novotný, Ota (vedoucí práce) ; Maryška, Miloš (oponent) V mé práci se věnuji problematice Data Miningu a jeho využití v komerční sféře. Konkrétně jsem se zaměřil na oblast marketingu a tvorbu forecastů. Cílem mé práce bylo nejprve získat a shromáždit znalosti z oblasti data miningu a ty následně využít k vytvoření forecastů prodeje pomocí data mining doplňku pro Excel. V první části práce shromažďuji teoretické informace o data miningu. Zaměřil jsem se na vlastní definice, metodologii, algoritmy a samozřejmě také i nejčastější využití algoritmů v praxi. Druhou část práce tvoří praktická aplikace získaných znalostí. Věnuji se tvorbě forecastů prodeje firmy HERO CZECH, s.r.o. K tomuto používám doplněk Data mining pro MS Excel 2007. Takto získané výsledky porovnávám s reálnými forecasty připravenými Key Account Managerem. Výsledky diplomové práce prokázaly, že sestavené forecasty doplňkem pro MS Excel 2007 nebyly přesnější než stávající forecasty vytvořené Key Account Managerem. Přesto věřím, že by využití data miningových metod našlo při přípravě forecastů využití, alespoň jako podpůrný prostředek. Úplný záznam
	Zpracování asociačních pravidel metodou vícekriteriálního shlukování Kejkula, Martin ; Rauch, Jan (vedoucí práce) ; Berka, Petr (oponent) ; Máša, Petr (oponent) Cílem této práce je navrhnout metodu, která by umožňovala zpracovat množinu asociačních pravidel: měla by poskytovat strukturovaný, přehledný popis celé množiny asociačních pravidel, získané libovolnou implementací nějakého algoritmu pro hledání asociačních pravidel v analyzovaných datech. Měla by uživateli poskytnout přehled o množině vygenerovaných asociačních pravidel a usnadnit její zpracování. Způsob dosažení cíle, zvolený v této práci je: rozdělit množinu asociačních pravidel do podmnožin. Asociační pravidla v jedné podmnožině by si měla být vzájemně více podobná než pravidla ze dvou různých podmnožin. Hlavním přínosem této práce je nová originální metoda zpracování asociačních pravidel. Vedlejším přínosem práce je rozsáhlá rešerše publikovaných metod zpracování asociačních pravidel. Metoda vícekriteriálního shlukování poskytuje rozdělení asociačních pravidel do skupin vzájemně si podobných pravidel (tzv. "přirozených shluků"), kterého není možné dosáhnout žádnou z doposud známých metod. Metoda používá nový způsob reprezentace asociačních pravidel, inspirovaný vektorovým modelem, používaným v oblasti zpracování informačních fondů (information retrieval). V práci je popsán převod asociačních pravidel do vektorového modelu, analogickému k vektorové reprezentaci dokumentů. Jádrem metody je dvojí, na sobě nezávislé shlukování asociačních pravidel: shlukování kvantitativních charakteristik (jako jsou např. spolehlivost, podpora, faktor zajímavosti) a cedentální shlukování asociačních pravidel (inspirované shlukováním dokumentů). Struktura práce: na úvodní kapitolu navazuje kapitola, popisující proces dobývání znalostí z databází. Proces je popsán na základě vybraných metodik (CRISP-DM, SEMMA, GUHA, RAMSYS).Třetí kapitola je věnována pojmu asociační pravidlo a charakteristikám asociačních pravidel. Další kapitola obsahuje rešerši současných metod post-processingu asociačních pravidel. Pátá kapitola seznamuje s problematikou shlukování. Šestá kapitola obsahuje popis metody vícekriteriálního shlukování asociačních pravidel. Další kapitola se věnuje experimentům. Osmá kapitola se zabývá možnostmi využití metody. Úplný záznam
	Míry kvality klasifikačních modelů a jejich převod Hanusek, Lubomír ; Hebák, Petr (vedoucí práce) ; Řezanková, Hana (oponent) ; Skalská, Hana (oponent) Prediktivní sílu klasifikačních modelů lze vyhodnotit různými ukazateli. V oblasti data miningu (dále DM) se nejvíce využívají míry Giniho koeficient, Kolmogorovova-Smirnovova statistika a lift. Tyto míry jsou založeny na zcela rozdílném způsobu výpočtu a je-li analytik zvyklý používat jednu z těchto měr, může být pro něj těžké udělat si představu o kvalitě modelu vyhodnoceném jinou mírou. Tato práce si klade za cíl nalézt mezi jednotlivými mírami převodní mechanismus. Přestože hlavní důraz je kladen na tři výše uvedené míry, práce se zabývá i dalšími ukazateli, a to sensitivitou, specificitou, celkovou správností a plochou pod ROC křivkou. Při vývoji DM modelů často vzniká potřeba pracovat nikoli s původním základním souborem o rozsahu miliónů či desítek miliónů pozorování, ale s výběrem, který je stratifikovaný dle hodnot vysvětlované proměnné Y. Vyhodnotí-li se pak model na stratifikovaných datech, vzniká potřeba vědět, jak se jednotlivé míry změní při přepočtu na základní soubor. Tato práce popisuje způsob, jak tento převod uskutečnit. Součástí této práce je i softwarová aplikace, která výše uvedené převody umožňuje. S její pomocí lze nejen převádět jednu míru kvality na druhou, ale také převádět míry získané na stratifikovaném souboru na soubor základní. Výstupem této aplikace je vedle požadovaných měr (sensitivita, specificita, celková správnost, Giniho koeficient, Kolmogorovova-Smirnovova statistika) také konfuzní matice a grafy kvality (lift křivka, gains křivka, ROC křivka a KS křivka). Internetová adresa, kde lze aplikaci stáhnout, a také uživatelský manuál k této aplikaci jsou součástí této práce. Veškerá teorie popsaná v této práci byla ověřena na reálných datových souborech. Úplný záznam
	Empirické porovnání komerčních systémů dobývání znalostí z databází Faruzel, Petr ; Berka, Petr (vedoucí práce) ; Máša, Petr (oponent) Předkládaná práce "Empirické porovnání komerčních systémů dobývání znalostí z databází" se zabývá systémy dobývání znalostí z databází od předních světových dodavatelů statistického softwaru. Cílem této práce je porovnat komerční systémy IBM SPSS Modeler a SAS Enterprise Miner na základě jejich specifikace a funkčnosti vzhledem k vybrané množině srovnávacích kritérií. Zvoleného cíle chci dosáhnout jednak rozborem vybraných vlastností analyzovaných systémů, jednak jejich aplikací na reálných datech. Základem srovnání je 29 dílčích kritérií odrážejících základní požadavky uživatele na funkcionalitu, použitelnost a otevřenost systému. Stěžejní částí celého srovnávacího procesu je praktické nasazení těchto systémů na datech o meningoencefalitidě. Jeho výsledkem je zhodnocení výkonnosti zkoumaných systémů při analýze malého a velkého objemu dat. Kvalita generovaných výstupů a doba jejich odvození jsou stanoveny na základě aplikace šesti srovnatelných klasifikačních metod dobývání znalostí z databází. Ukázalo se, že systému IBM SPSS Modeler vyhovuje spíše menší objem dat. Nepatrně nižší přesnost klasifikace nalezených datových modelů je zastíněna podstatně vyšší rychlostí jejich odvození. S růstem objemu analyzovaných dat se však situace mění ve prospěch konkurenčního systému. Při analýze velkých dat dosahuje výrazně lepších výsledků systém SAS Enterprise Miner. Podstatně vyšší přesnost klasifikace nalezených modelů je umocněna mírně kratší dobou jejich odvození. Zatímco funkcionalitu analyzovaných systémů lze označit za srovnatelnou, ze srovnání jejich použitelnosti vyšel jako jasný vítěz systém IBM SPSS Modeler. Zhodnocení otevřenosti těchto systémů staví do role mírného favorita systém SAS Enterprise Miner. Úplný záznam
	Využití služeb sociálních sítí ve firmě Chernenko, Nina ; Šedivá, Zuzana (vedoucí práce) ; Žid, Norbert (oponent) Cílem práce je zpřehlednit pro čtenáře problematiku existujících sociálních sítí, provést jejich analýzu dle kategorií a naznačit možnosti využití nabízených služeb pro firmy. Způsobem dosažení postavených cílů byla podrobná analýza každé popsané sociální sítě v této práci na základě vlastního vyzkoušení nabízených služeb. Přínosem práce je analýza sociálních sítí dle jejich typů a možnosti využití služeb pro komerční účely. Práce je doplněna o případovou studii, ve které se připojila firma Regabus do sociální sítě Facebook. Úplný záznam
	Využití principů business intelligence v dotazníkových šetřeních Hanuš, Václav ; Maryška, Miloš (vedoucí práce) ; Novotný, Ota (oponent) Tato práce je zaměřena na praktické použití nástrojů pro dolování dat a business intelligence. Mezi hlavní cíle patří zpracování zdrojových dat do vhodné podoby a zkušební nasazení vybraného nástroje na testovací úloze. Jako vstupní data posloužila databáze vzniklá zpracováním dotazníkových šetření, užitých pro ověření úrovně výuky IT a ekonomických předmětů napříč českými vysokými školami. Tyto data jsem následně upravil tak, aby je bylo možné zpracovat pomocí nástrojů pro dolování dat, které jsou obsaženy v balíku software Microsoft SQL Server 2008. Pro ověření možností jsem zvolil dvě úlohy. První úloha byla zaměřena na shlukování s využitím algoritmu Microsoft Clustering. Její náplní bylo roztřídění škol do shluků na základě jednotlivých atributů odpovídajících skupinám předmětů ohodnocených počty kreditů z nich získaných. Při řešení nastaly dva problémy. Bylo třeba snížit počet skupin předmětů, jinak hrozilo, že pro shlukování vznikne větší množství shluků, než dovedu pojmenovat. Dalším problémem bylo nestejnoměrné ohodnocení jednotlivých skupin předmětů a od toho se odvíjející problémy s váhami jednotlivých atributů. Řešení bylo nakonec vcelku jednoduché. Ve skupinách předmětů jsem vybral atributy, které se obsahově blíží nebo se překrývají a ty jsem následně sloučil do obecnějších kategorií. Co se týče následného nestejnoměrného rozložení kreditů použitých pro ohodnocení, pomocí parametru jsem každou nově vzniklou skupinu předmětů převedl na stupnici 0-5. Ve druhé úloze jsem se zaměřil na předpověď budoucí hodnoty a využití algoritmů Microsoft Logistic Regresion a Microsoft Neural Network. Zde bylo cílem provést předpověď počtu studujících studentů. K dispozici byla historická data z let 2001-2009. Na jejich základě byl sestrojen prediktivní model, jehož výsledky jsem mohl porovnat se skutečnými daty. Také bylo v rámci řešení potřeba upravit zdrojová data tak, aby umožnila nasazení testovaného nástroje. Původní data byla umístěna v pohledu namísto tabulky a navíc data obsahovala i záznamy nejenom o studujících, ale i různě roztříděné. Například podle pohlaví. Řešením bylo tedy vytvoření nové tabulky, do které se umístily jen záznamy podstatné pro řešenou úlohu. Posledním problém nastal při pokusu o predikci roku 2010, ke kterému nebyla skutečná data. Software nahlásil chybu a predikci neprovedl. Při mém pátrání, jsem na technické podpoře společnosti Microsoft nalezl několik odkazů na podobný problém, takže je pravděpodobné, že se jedná o systémovou chybu, která bude opravená v rámci aktualizace. Splnění těchto úkolů mi poskytlo dostatek indicií pro ověření možností softwaru dodávaného společností Microsoft. Po mých předchozích školních zkušenostech se software pro dolování dat od společností IBM (dříve SSPS) a SAS tak mohu dobře porovnat, zda se prověřovaný nástroj těmto hlavním hráčům na trhu dokáže vyrovnat a zda je vhodný pro seriózní využití. Úplný záznam
	Přístupy k řešení digitalizace dokumentů. Novotný, Vladimír ; Šedivá, Zuzana (vedoucí práce) ; Benáčanová, Helena (oponent) Cílem práce je přinést pohled na digitalizaci dokumentů a provést analýzu trhu společností provádějící outsourcing digitalizace dokumentů. V první části práce je popsána technologie skenování, dále jsou popsány metody rozpoznávání a vytěžování dat. Práce také popisuje i systémy čárových kódů používaných k identifikaci dokumentů. Součástí práce jsou principy ukládání dokumentů i pohled na problematiku digitálního (elektronického) podpisu, a to i z hlediska české právní úpravy. Přínosem této práce je analýza společností provádějících outsourcing digitalizace dokumentů a dále pak pohled na společnost využívající tyto služby. V práci je zmíněn i autorův pohled do blízké budoucnosti popisované problematiky. Úplný záznam
	Business Intelligence analýza podnikání v lékárně Alfa ve městě Nymburk Vítek, Pavel ; Novotný, Ota (vedoucí práce) ; Červinková, Miroslava (oponent) Práce se zabývá problematikou analýzy podnikání reálného subjektu -- lékárny, v tržním prostředí města Nymburk. Hlavním tématem práce je výzkum aktuální pozice lékárny na trhu v kontextu vývoje situace lokálního trhu a příchodu nového konkurenčního subjektu na tento trh. Práce se dělí na dva logické celky. Prvním je krátký teoretický úvod, který rozebírá užité metody a obecné předpoklady trhu ve městě Nymburk. V druhém celku je pak analyzován podnik jako takový a vývoj prodejů volně prodejných léčiv v kontextu vstupu nové konkurence na trh. K naplnění cílů je užita metoda SWOT analýzy k určení silných a slabých stránek podniku a k určení hrozeb a příležitostí, které vyplývají z podnikového okolí -- tedy lokálního trhu. Na tuto metodu navazuje metoda Balanced Scorecard, která je využita pro navržení ukazatelů měření a sledování budoucího vývoje a výkonu podniku. V závěru výzkumu jsou využity dataminingové metody nákupního košíku, segmentace a predikce časového vývoje prodejů volně prodejných léčiv. Všechny tyto metody slouží k vytvoření podkladového rámce pro budoucí rozhodování managementu a strategické a taktické řízení podniku. Úplný záznam
	Systém předzpracování dat pro dobývání znalostí z databází Kotinová, Hana ; Berka, Petr (vedoucí práce) ; Šimůnek, Milan (oponent) Abstrakt Cílem diplomové práce bylo vytvoření aplikace pro předzpracování dat, pracující se soubory ve formátu csv. Aplikaci lze využít při přípravě dat pro data miningové úlohy. Aplikace byla vytvořena pomocí programovacího jazyka Java. Tento text obsahuje výklad problematiky související s předzpracováním dat, popis používaných algoritmů, informace o podobných o systémech Mining Mart and SumatraTT a popis vytvořené aplikace. Úplný záznam

Chcete být upozorněni, pokud se objeví nové záznamy odpovídající tomuto dotazu?
Přihlásit se k odběru RSS.

Digitální repozitář :: :: :: ::
Powered by v1.1.2
Spravuje

Tato stránka je dostupná také v následujících jazycích:
Česky English