National Repository of Grey Literature 84 records found  beginprevious21 - 30nextend  jump to record: Search took 0.01 seconds. 
Using Data Mining in Various Industries
Fabian, Jaroslav ; Novotný, Jakub (referee) ; Kříž, Jiří (advisor)
This master’s thesis concerns about the use of data mining techniques in banking, insurance and shopping centres industries. The thesis theoretically describes algorithms and methodology CRISP-DM dedicated to data mining processes. With usage of theoretical knowledge and methods, the thesis suggests possible solution for various industries within business intelligence processes.
Classifier of astrophysics data
Rylko, Vojtěch ; Vrábelová, Pavla (referee) ; Zendulka, Jaroslav (advisor)
Cílem této práce je implementace algoritmu pro dolování z dat pro použítí v astrofyzice. V práci jsou představeny základní pojmy a principy dolování z dat. Zejména jeho obecná definice, rozlišení mezi klasifikací a regresí a vyhodnocování přesnosti modelu. Text se zabývá převážně učením s učitelem. Blíže představeny jsou algoritmy založené na rozhodovacích stromech. Je definován rozhodovací strom jako model a uveden obecný algoritmus pro tvorbu rozhodovacích stromů z dat. Jsou diskutována různá kritéria dělení v uzlech (zejména založená na etropii), kritéria pro ukončení růstu a ořezávání stromů. Pro ilustraci jsou uvedeny vybrané algoritmy - ID3, CART, RainForest a BOAT. Na dříve uvedených informacích je založena kapitola o souborech rozhodovacích stromů. Zabývá se základními způsoby jejich kombinací (bagging a arcing) . Detailněji je popsán obecný algoritmus náhodných lesů a RandomForest TM jako příklad jeho praktické realizace. Na základě srovnání algoritmů a provedených experimentů v literatuře jsou k implementaci vybrány náhodné lesy. Implementovaný algoritmus je detailněji popsán - k dělení uzlů používá Gini entropie a průměrnou kvadratickou chybu, ignoruje chybějící hodnoty a pro kombinaci výstupů jednotlivých stromů používá většinové hlasování / průměr. Jako formát vstupních a výstupních dat je zvolena podmnožina ARFF formátu. Architektura implementace je ilustrována UML diagramy s popisujícím komentářem. Jednotlivé aspekty implementace jsou stručně popsány - implementačním jazykem je C++11, je využívána knihovna Boost (zejména chytré ukazatele, serializace, nastavení parametrů a konfigurační soubory, ...) společně s dalšími volně dostupnými knihovnami (google-glog pro logování, googletest pro jednotkové testování, ...). Grafického výstupu je dosaženo tiskem modelu náhodného lesu do XML souboru a jeho transformací skriptem do jazyka DOT. Pro oveření validity a vlastností implementace a jejího srovnání s jinými implementacemi náhodných stromů (Waffles, RF-ACE a R - balíček randomForest) jsou navrženy, popsány a provedeny exprimenty: klasifikace astronomických těles na základě barevných indexů, regrese rudého posuvu na základě barevných indexů, osm klasifikačních a pět regresních experimentů na datech z UCI repository. Průběh experimentů je plně automatizován skripty (Bash, Python a R) a je měřena doba učení modelů. Z výsledků experimentů vyplývá, že autorova implementace si vedla výborně při klasifikaci a průměrně při regresi; z časového hlediska měla problémy při datech s mnoha instancemi. Výsledkem práce je zdokumentovaná, snadno rozšiřitelná implementace náhodných lesů v jazyce C++ s grafickým znázorněním modelu, mnoha možnostmi nastavení a experimentálně ověřenou funkčností. Diskuze o dalším možném pokračování projektu se zabývá zejména odstraněním problemů s časovou náročností a přídáním nových funkcionalit.
The identification of objects in an image
Štěpán, Filip ; Malach, Tobiáš (referee) ; Boleček, Libor (advisor)
The aim of this paper is the creation of an algorithm for identification of objects in an image. The resulting programme will be able to process real visual data. This is the reason why the emphasis is put mainly on the complexity of the environment in which the objects are found, reliable segmentation and quality of the object identification. The paper is further focused on the detection and the identification of vertical traffic signs in an image that are found alongside road communication on the territory of the Czech Republic.
Data Mining
Slezák, Milan ; Hynčica, Ondřej (referee) ; Honzík, Petr (advisor)
The thesis is focused on an introduction of data mining. Data mining is focused on finding of a hidden data correlation. Interest in this area is dated back to the 60th the 20th century. Data analysis was first used in marketing. However, later it expanded to more areas, and some of its options are still unused. One of methodologies is useful used for creating of this process. Methodology offers a concise guide on how you can create a data mining procedure. The data mining analysis contains a wide range of algorithms for data modification. The interest in data mining causes that number of data mining software is increasing. This thesis contains overviews some of this programs, some examples and assessment.
Design of a Predictive User Loyalty Model Based on Machine Learning
Kuchtová, Dominika ; Bartík,, Vladimír (referee) ; Doubravský, Karel (advisor)
The bachelor thesis focuses on creating an optimal model for evaluating specific phenomena related to modeling customer behavior with the aim of support decision-making. It describes the process of data handling and the significance of the importance of converting data into knowledge. The first part of the bachelor thesis includes a description of the tools, processes, ideas, and methods used in the practical part at a theoretical level for an easier understanding of how to solve the assignment in the practical part of the thesis. The second part of the bachelor thesis includes the practical application of specific procedures and the creation of the actual predictive model based on the XGBoost ensemble method and its optimization.
Design and realization of 3D game
MUDRA, Štěpán
The goal of this thesis was to design and create a 3D game with the use of graphical assets. In particular, the Unity game engine was used to create the game. Visual Studio and Rider were used to write the program. In the game, the player can encounter enemies whose decision-making is based on different methods. The first one is making decisions according to a single criterion. The next is a multi-criteria-based decision model. Preferences for each action can be set to the model. The search for the optimal setting was performed using a genetic algorithm. The decision-making of the third enemy that the player may encounter is based on the use of a neural network, whose output is then converted into the action that the enemy character performs.
Fundamental Analysis for Automatic Trading Systems
Miček, Marek ; Kanich, Ondřej (referee) ; Rozman, Jaroslav (advisor)
This thesis deals with the creation of automatic trading systems which are able to predict market trends for stocks selected in advance. Proper trading strategy of this system is mainly created from the elements of fundamental analysis, such as annual returns of company, it's gains, level of shareholder's equity or total debt. All the stocks are classified by these fundaments, where result of this classification determines whether to buy or sell the stock. For the purpose of this thesis, 5 autamatic trading systems were created in order to compare different approaches to the stock evaluation, managment or diversification of business portfolio. Created systems were properly tested on historical data and, in order to determine their level of complexity, tests were executed in both periods of economic recession and expansion too. All the created systems reported great returns and most of them have potential to generate long-term gains. On the basis of received results, it is possible to make conclusion that fundamental analysis has a high value in the field of automatic trading systems, and it increases the chances of generating a profit.
Detection of modern Slow DoS attacks
Jurek, Michael ; Jonák, Martin (referee) ; Sikora, Marek (advisor)
S rozvojem propojených zařízení v síti internet se počet útoků zvětšuje. Útočníci můžou zneužít takového zranitelného zařízení a vytvořit (D)DoS útok proti své oběti. Tyto útoky se stávají čím dál tím víc sofistikovanější. Proto byla vytvořena nová kategorie DoS útoků s názvem Pomalé DoS útoky, u kterých se útočník snaží napodobit chování standardního uživatele. Útočník se snaží využít všech možností, které mu transportní či aplikační protokol umožňují jako např. náhodné zahazování paketů, neodesílání nebo pozdržování zpráv. Na druhou stranu tvorba vlastních aplikačních výplní těchto protokolů může způsobit stav odepření služby na cíleném aplikačním serveru. Tato práce navrhuje klasifikaci síťových toků a volbu parametrů, které můžou pomoci s detekcí pomalých DoS útoků. Mezi vybranými pomalými DoS útoky jsou Slow Read, Slow Drop a Slow Next. Pro každý útok je popsán proces komunikace z pohledu transportní a aplikační vrstvy. Dále jsou vybrány důležité parametry popisující tyto útoky a v neposlední řadě jsou diskutovány metody a nástroje umožňující tvorbu takových útoků. Tato práce se zabývá možnostmi a nástroji tvorby spojení pro útok a diskutuje základní komunikační koncepty tvorby paralelních spojení. Dále je navržen vlastní generátor pomalých DoS útoků s velkým množstvím parametrů, pomocí nichž může útočník definovat vlastní pomalé DoS útoky. Následující část popisuje testovací prostředí pro testování generovaných útoků, scénáře a nástroje zachycování síťového provozu pro tvorbu vlastního datového souboru, jež je dále použit pro detekci pomalých DoS útoků pomocí metod strojového účení s učitelem. Konrétně jsou použity rozhodovací stromy a náhodné lesy k výběrů důležitých paramterů či sloupců použitelných pro detekci pomalých DoS útoků.
Factors influencing customer profitability: an empirical examination in noncontractual settings
Hanuska, Norbert ; Kyjonka, Vladimír (advisor) ; Král, Jaroslav (referee)
Understanding of how to manage relationships with customers has become an important topic for both academic and practitioners in recent years. The effectiveness of business can be greatly improved by identifying the drivers of the most profitable customers and using them to target the right customers. In this study we identify exchange characteristics such as amount of money spent per purchase, customer relationship duration with firm, ratio of cross-buying and demographic characteristics such as age and gender as important drivers of the most profitable customers. The results of the study have important implications for academicians in understanding what drives the most profitable customers in noncotractual settings as well as practitioners to help design more effective marketing strategies. Moreover, the results of knowledge discovery about customers by different data mining techniques also contribute to help researchers identifying feasibility of these methods. Powered by TCPDF (
Comparison of logistic regression and decision trees
Raadová, Zuzana ; Voříšek, Jan (advisor) ; Komárek, Arnošt (referee)
In this thesis we describe a classification of the binary data. For discussing this problem we use two well-known methods - logistic regression and decision trees. These methods deal with the problem in different way, so our aim is to compare a successfulness of their predictions. At first a model of logistic regression is introduced and we show how to estimate its parameters using a method of maximum likelihood. Then we describe decision trees as one of the most popular classification tools. There are discussed older classic algorithms CART and C4.5 and also two new algorithms GUEST and CRUISE. The predictions of both of the methods are shown on a real data example.

National Repository of Grey Literature : 84 records found   beginprevious21 - 30nextend  jump to record:
Interested in being notified about new results for this query?
Subscribe to the RSS feed.