Národní úložiště šedé literatury Nalezeno 83 záznamů.  začátekpředchozí74 - 83  přejít na záznam: Hledání trvalo 0.00 vteřin. 
Využití statistických metod v data miningu při predikci chování zákazníků internetového obchodu
Podzimková, Michaela ; Vilikus, Ondřej (vedoucí práce) ; Berka, Petr (oponent)
Data mining je nová disciplína, která se objevuje s rostoucím množstvím ukládaných dat a s rostoucí potřebou získat informace v nich ukryté. Zabývá se extrahováním potenciálně užitečných informací z velkých datových souborů a leží na pomezí statistiky, strojového učení, umělé inteligence, databází a dalších oborů. Cílem této diplomové práce je představit celý proces data miningu s důrazem na jeho spojitost se statistikou a popsat vybrané statistické metody, které se v této oblasti hodně používají a které jsou v práci aplikovány na vlastní řešení dataminingového problému. Na reálných datech o nákupech v internetovém obchodě je ukázáno, že využití různých metod přináší různé výsledky a zajímavé poznatky o nákupním chování, a také vede k dokázání, že ne všechny metody jsou vždy použitelné na všechny typy úloh.
Explaining Anomalies with Sapling Random Forests
Pevný, T. ; Kopp, Martin
The main objective of anomaly detection algorithms is finding samples deviating from the majority. Although a vast number of algorithms designed for this already exist, almost none of them explain, why a particular sample was labelled as an anomaly. To address this issue, we propose an algorithm called Explainer, which returns the explanation of sample’s differentness in disjunctive normal form (DNF), which is easy to understand by humans. Since Explainer treats anomaly detection algorithms as black-boxes, it can be applied in many domains to simplify investigation of anomalies. The core of Explainer is a set of specifically trained trees, which we call sapling random forests. Since their training is fast and memory efficient, the whole algorithm is lightweight and applicable to large databases, datastreams, and real-time problems. The correctness of Explainer is demonstrated on a wide range of synthetic and real world datasets.
Interpreting and Clustering Outliers with Sapling Random Forests
Kopp, Martin ; Pevný, T. ; Holeňa, Martin
The main objective of outlier detection is finding samples considerably deviating from the majority. Such outliers, often referred to as anomalies, are nowadays more and more important, because they help to uncover interesting events within data. Consequently, a considerable amount of statistical and data mining techniques to identify anomalies was proposed in the last few years, but only a few works at least mentioned why some sample was labelled as an anomaly. Therefore, we propose a method based on specifically trained decision trees, called sapling random forest. Our method is able to interpret the output of arbitrary anomaly detector. The explanation is given as a subset of features, in which the sample is most deviating, or as conjunctions of atomic conditions, which can be viewed as antecedents of logical rules easily understandable by humans. To simplify the investigation of suspicious samples even more, we propose two methods of clustering anomalies into groups. Such clusters can be investigated at once saving time and human efforts. The feasibility of our approach is demonstrated on several synthetic and one real world datasets.
Statistical Expectation of High Energy Physics Data Sets Separation Algorithms
Hakl, František
Article focuses on the application of the basic results of the statistical learning theory known as Probabilistic Approximately Correct learning in the evaluation and post-processing of unique physical data obtained from the detectors of particle accelerators. The aim of this article is not direct separation of the measured data but evaluation of the appropriateness of separation methods used. The main principles and results of the PAC learning theory are briefly summarized, the main characteristics of selected multivariable data separation algorithms are studied from the VC-dimension point of view. Finally, based on actual data sets obtained from Tevatron D$\emptyset$ experiment, some practical hints for separation method selection and numerical computation are derived.
Datamining - teorie a praxe
Popelka, Aleš ; Maryška, Miloš (vedoucí práce) ; Machač, Ivo (oponent)
Tato diplomová práce zpracovává téma technologie zvané data mining. Práce nejdříve popisuje data mining jako svébytný obor a dále jeho procesní postupy a nejčastější využití. Samotný pojem data mining je poté vysvětlen pomocí metodik popisujících jednotlivé části procesu dobývání znalostí z databází - CRISP-DM, SEMMA. Práce si dává za cíl představit hlavní metody data miningu a konkrétní algoritmy - rozhodovací stromy, neuronové sítě a genetické algoritmy, přičemž tato fakta jsou zároveň použita jako určitý teoretický úvod, na který navazuje praktická aplikace. V této aplikaci jde o hledání příčin vzniku meningoencefalitidy u určitého vzorku pacientů. Pro analýzu byly použity rozhodovací stromy v systému Clementine, který patří ke špičce dataminingových nástrojů.
Využití data miningu v řízení podniku
Prášil, Zdeněk ; Pour, Jan (vedoucí práce) ; Novotný, Ota (oponent)
Ve své diplomové práci jsem zkoumal, jakým způsobem lze zpracovat podniková data pomocí data miningu a jak využít získaných výsledků pro lepší řízení podniku. Práce je rozdělena na teoretickou část a na část praktickou. Cílem teoretické části práce bylo zjistit: 1/ jaké jsou nejčastěji využívané metody data miningu, 2/ definovat typické aplikační oblasti, 3/ ukázat typické úlohy, které se v těchto oblastech řeší. Cílem praktické části bylo zjistit: 1/ jak může data mining pomoci malému českému elektronickému obchodu k lepšímu pochopení struktury prodeje, 2/ jak může data mining zlepšit výsledky prodeje. Ve své práci jsem zjistil, že nejčastěji používané metody data miningu jsou rozhodovací stromy, lineární a logistická regrese, neuronové sítě, segmentační metody a asociační pravidla. Nejčastější používané obchodní aplikační oblasti jsou CRM a marketing, finanční instituce, pojišťovnictví, telekomunikace, maloobchod a výroba. Úlohy jsou odvislé od typu aplikační oblasti, nejčastěji se úlohy týkají sledování a odhadování chování zákazníků. Analýzou dat elektronického obchodu jsem zjistil, které výrobky jsou spolu nakupovány, což může vést k akcím pro podporu prodeje. Ukázal jsem, že data mining je možné použít i v malém elektronickém obchodě a že i zde může přispět k zefektivnění případných marketingových akcí.
Hodnocení strategických záměrů za podmínek rizika - rozhodování o investování prostřednictvím aparátu rozhodovacích stromů
JÍCHOVÁ, Romana
V diplomové práci jsem se zabývala investičním rozhodováním, metodami hodnocení investic a rozhodováním za rizika a nejistoty. Cílem diplomové práce bylo zhodnotit možnosti uplatnění matematických metod při výběru investičních variant. Hlavním úkolem bylo ukázat možnost využití aparátu rozhodovacích stromů, které jsou grafickým nástrojem pro zobrazení všech možných akcí rozhodovacího procesu. Postup sestrojení rozhodovacího stromu byl názorně ukázán na dvou příkladech z praxe, na příkladu prodeje nemovitostí a na příkladu těžby ropy.

Národní úložiště šedé literatury : Nalezeno 83 záznamů.   začátekpředchozí74 - 83  přejít na záznam:
Chcete být upozorněni, pokud se objeví nové záznamy odpovídající tomuto dotazu?
Přihlásit se k odběru RSS.