National Repository of Grey Literature 65 records found  beginprevious56 - 65  jump to record: Search took 0.01 seconds. 
Comparison of the potency of application KDD methods and statistical methods in the analysis of ADAMEK data
Líbal, Petr ; Rauch, Jan (advisor) ; Berka, Petr (referee)
This bachelor thesis compares association rules and logistic regression. For this comparison medical data Adamek have been used. The relationship between attributes belonging to a group of Physical examinations and Difficulty has been studied. Both methods are theoretically described, their connection with the related common areas is mentioned - the analysis of market basket in the case of association rules, linear regression in the case of logistic regression. Before the analysis attributes are described with basic statistics and the distribution of values is graphically illustrated. In both cases, analysis proceed the same way. First, the relationship of each difficulty is examined, then is examined relationship of difficulties in general. In conclusion, the results of both methods is compared.
Empirical comparison of free software suites for knowledge discovery from data
Kasík, Josef ; Berka, Petr (advisor) ; Rauch, Jan (referee)
Both topic and main objective of the diploma thesis is a comparison of free data mining suites. Subjects of comparison are six particular applications developed under university projects as experimental tools for data mining and mediums for educational purposes. Criteria of the comparison are derived from four general aspects that form the base for further analyses. Each system is evaluated as a tool for handling real-time data mining tasks, a tool supporting various phases of the CRISP-DM methodology, a tool capable of practical employment on certain data and as a common software system. These aspects bring 31 particular criteria for comparison, evaluation of whose was determined by thorough analysis of each system. The results of comparison confirmed the anticipated assumption. As the best tool the Weka data mining suite was evaluated. The main advantages of Weka are high number of machine learning algorithms, numerous data preparation tools and speed of processing.
Knowledge Processing within the GUHA Method
Šťastný, Daniel ; Rauch, Jan (advisor) ; Kliegr, Tomáš (referee)
This study presents an introduction into the data-mining methodology CRISP-DM (CRoss-Industry Standard Process for Data Mining). It provides a fundamental description of association rules and the GUHA method (General Unary Hypotheses Automaton) with related 4ft-Miner, SD4ft-Miner and Action Rules. The examples are shown on real data. Sequentially the study describes the role of the domain knowledge and the project SEWEBAR (SEmantic WEb and Analytical Reports) held at UEP. The practical output of this work is the XML Schema definition for the markup language BKEF (Background Knowledge Exchange Format) designed within the SEWEBAR and the transformation file programmed in the XSL ensuring visualization of the content of any BKEF file.
Aplikace procedury SD4ft-Miner na medicínská data
Kubín, Richard ; Rauch, Jan (advisor) ; Berka, Petr (referee) ; Nováček, Jan (referee)
Cílem práce je, aby byla příkladem pro ostatní uživatele, kteří chtějí pomocí procedury SD4ft-Miner hledat vztahy mezi skupinami ve svých datech. Práce zaznamenává můj postup, podle kterého jsem aplikaci procedury na medicínská data prováděl a lze tento postup aplikovat na jiná podobná data. K proceduře SD4ft-Miner v současnosti neexistuje český návod, pouze článek v angličtině. Dokonce ani nejsou s touto procedurou žádné zkušenosti. Vzhledem k těmto okolnostem bude postup aplikace procedury na data přínosem v této oblasti.
Image classification on the web
Daráni, Jakub ; Rauch, Jan (advisor) ; Berka, Petr (referee)
This thesis is dealing with image classification on the web. According to the thinking about possibilities how to classify images and suggestion of features contents theory of image processing and classification. This theoretical knowledge is used by development of the software with original algorithms (image segmentation, image correlation). Using training set, estimated features values and Weka software a classifier is developed. This classifier is implemented, tested on testing set and reviewed.
Testování softwarového systému Ferda pro dobývání znalostí z databází
Moulis, Martin ; Rauch, Jan (advisor) ; Ralbovský, Martin (referee)
Základním cílem práce je otestovat softwarový produkt Ferda Data Miner a srovnat jej se systémem 4ft Miner. Po vytvoření vlastního souboru testovacích úloh byla provedena měření počtu vydaných hypotéz, počtu verifikací a rychlosti programu Ferda. Výsledky měření ukazují na nesrovnalosti v počtu nalezených hypotéz a výrazně nižší rychlost systému Ferda ve srovnání s 4ft Minerem. Závěr práce obsahuje shrnutí výsledků a doporučení, kterým směrem by mělo pokračovat případné další testování.
Social Bookmarking
Holásek, Jakub ; Rauch, Jan (advisor) ; Svátek, Vojtěch (referee) ; Nováček, Jan (referee)
Práce je základním informačním podkladem pro pochopení Social Bookmarkingu, jeho aspektů, nástrojů a využití nejen pro jednotlivé uživatele ale i pro skupiny. Zahrnuje zhodnocení těchto nástrojů, jejich kladné i záporné stránky včetně praktických ukázek.
Clickstream Analysis
Kliegr, Tomáš ; Rauch, Jan (advisor) ; Berka, Petr (referee)
Thesis introduces current research trends in clickstream analysis and proposes a new heuristic that could be used for dimensionality reduction of semantically enriched data in Web Usage Mining (WUM). Click-fraud and conversion fraud are identified as key prospective application areas for WUM. Thesis documents a conversion fraud vulnerability of Google Analytics and proposes defense - a new clickstream acquisition software, which collects data in sufficient granularity and structure to allow for data mining approaches to fraud detection. Three variants of K-means clustering algorithms and three association rule data mining systems are evaluated and compared on real-world web usage data.
Využití Porterova modelu v konkurenčním zpravodajství
Struška, Michal ; Rauch, Jan (advisor) ; Nemrava, Jan (referee)
Bakalářská práce se zabývá využitím Porterova modelu v oboru konkurenční zpravodajství (CI). Práce se skládá ze dvou částí. První z nich je seznámení se s oborem konkurenčního zpravodajství doplněné o teorii týkající se Porterova modelu. Tvoří tedy teoretický základ této práce. Část obsahující teorii se skládá ze čtyř kapitol. Teoretická část začíná kapitolou, která definuje termín konkurenční zpravodajství a popisuje druhy zdrojů, se kterými CI pracuje. Následuje kapitola popisující roviny působení konkurenčního zpravodajství v ekonomické sféře. Třetí kapitola se zabývá porovnáním tohoto oboru ve světě. A poslední neodmyslitelnou kapitolou v teoretické části je situace konkurenčního zpravodajství v České republice. Druhou částí práce je aplikace Porterova modelu při analýze konkurenčního prostředí v oblasti soukromých detektivních kanceláří. Členění praktické části odpovídá struktuře Porterova modelu. Jedná se tedy o informace o stávající konkurenci, bariérách vstupu na trh, dodavatelích, odběratelích a možných substitutech. Závěr praktické části shrnuje výsledky Porterova modelu a obsahuje doporučení pro budoucího podnikatele na trhu s detektivními službami na území středočeského kraje.
Rozšíření systému AR2NL pro další procedury systému LISp-Miner
Koman, Michal ; Strossa, Petr (advisor) ; Rauch, Jan (referee)
Tato diplomová práce se věnuje především rozšířením týkající se systému AR2NL, jenž slouží pro převod asociačních pravidel do přirozeného jazyka. Pro samotný převod těchto pravidel se používají množiny formulačních vzorců. Také se využívají tabulky s elementárními výrazy a tabulky pro skloňování podstatných jmen, časování sloves apod. Uvedené tabulky jsou závislé na věcné oblasti, kterých se asociační pravidla týkají. Přestože je systém AR2NL účinný nástroj pro snadnější porozumění asociačním pravidlům, jeho podstatnou slabostí je nesnadná úprava formulačních vzorců. Z toho důvodu bylo potřeba vytvořit AR2NL Editor, jehož úkolem je usnadnit práci nejen s vytvářením nových a editací stávajících formulačních vzorců, ale také tabulek pro skloňování a časování slov.

National Repository of Grey Literature : 65 records found   beginprevious56 - 65  jump to record:
See also: similar author names
2 Rauch, Jan
Interested in being notified about new results for this query?
Subscribe to the RSS feed.