National Repository of Grey Literature 74 records found  1 - 10nextend  jump to record: Search took 0.00 seconds. 
Implementation of Mining Modules of Data Mining System on NetBeans Platform
Stríž, Rostislav ; Bartík, Vladimír (referee) ; Šebek, Michal (advisor)
Data collecting plays an important role in many aspects of today's businesses and quality information is the key to success. Process called Knowledge Discovery in Databases makes possible to extract hidden information that can be used further in our efforts. Main goal of this thesis is to describe an addition to such Data Mining System. Main objective is to create data mining module for NetBeans application, developed for demonstrational purposes by Faculty of Information Technology. New module is going to be able to mine information from Oracle database server via unusual use of Genetic Algorithm. This thesis describes the whole process of module implementation, begining with theoretical basics through coding details to final testing and summary.
Multi-Label Classification of Text Documents
Průša, Petr ; Očenášek, Pavel (referee) ; Bartík, Vladimír (advisor)
The master's thesis deals with automatic classifi cation of text document. It explains basic terms and problems of text mining. The thesis explains term clustering and shows some basic clustering algoritms. The thesis also shows some methods of classi fication and deals with matrix regression closely. Application using matrix regression for classifi cation was designed and developed. Experiments were focused on normalization and thresholding.
Classification on unbalanced data
Hlosta, Martin ; Popelínský, Lubomír (referee) ; Štěpánková,, Olga (referee) ; Zendulka, Jaroslav (advisor)
Tématem této disertační práce je klasifikace daty s nevyváženými daty. Jedná se o oblast strojového, jejímž cílem je řešit problémy, které plynou z toho, že jedna ze tříd je v datech zastoupena výrazně méně než třída druhá. Minoritní třída má často větší význam a tradiční metody upřednostňující majoritní třídu nedosahují dobrých výsledků na třídě minoritní. Dvě aplikační domény motivovaly výzkum a vedly na identifikaci dvou specifických, dosud neřešených problémů.  V první z nich vedlo omezení kladené na minimální požadovanou přesnost na minoritní třídě v počítačové bezpečnosti na formulaci úlohy klasifikace s omezením. Navrhl jsem metodu, která kombinuje upravenou verzi logistické regrese a stochastické algoritmy, které vždy vylepšily výsledky logistické regrese.Druhou je doména analýzy učení (Learning Analytics), která motivovala definici problému predikce splnění cíle, jenž má specifikovaný termín splnění. Byl představen koncept sebe-učení (Self-Learning), kdy trénování modelu probíhá díky jedincům, kteří tento cíl splní předčasně. Díky malému počtu jedinců splňujících úlohu na začátku je problém silně nevyvážený, ale nevyváženost klesá směrem k termínu splnění. Na problému identifikace rizikových studentů distanční univerzity bylo ukázáno, že (1) takový koncept dává lepší výsledky než specifikovaná základna (baseline), (2) a že metody pro vypořádání se s nevyvážeností, které neberou v potaz informaci o doméně, nevedly k velkým zlepšením. Evaluace ukázala, že metody založené na znalosti domény v rozšířené verzi pro Self-Learning vylepšily klasifikaci více než běžné metody pro vypořádání se s nevyvážeností a že znalost příčiny nevyváženosti může vést k lepším výsledkům.
Multi-Level Association Rules Module of a Data Mining System
Pospíšil, Jan ; Bartík, Vladimír (referee) ; Zendulka, Jaroslav (advisor)
This thesis focuses on the problematics of implementing a multilevel association rules mining module, for existing data mining project. There are two main algorithms explained, Apriori and MLT2L1. The thesis continues with the datamining module implementation, as well as the DMSL elements design. In the final chapters deal with an example dataminig task and its result comparison as well as the whole thesis achievement description.
Using of Data Mining Method for Analysis of Social Networks
Novosad, Andrej ; Očenášek, Pavel (referee) ; Bartík, Vladimír (advisor)
Thesis discusses data mining the social media. It gives an introduction about the topic of data mining and possible mining methods. Thesis also explores social media and social networks, what are they able to offer and what problems do they bring. Three different APIs of three social networking sites are examined with their opportunities they provide for data mining. Techniques of text mining and document classification are explored. An implementation of a web application that mines data from social site Twitter using the algorithm SVM is being described. Implemented application is classifying tweets based on their text where classes represent tweets' continents of origin. Several experiments executed both in RapidMiner software and in implemented web application are then proposed and their results examined.
Analysis and Monitoring of Business Processes
Procházková, Martina ; Zámečníková, Eva (referee) ; Pospíšil, Milan (advisor)
This thesis includes study on Process Mining, Data Mining in general, classification and prediction methods, business process management and simulation. It also includes program made for creating simulation data and testing Process Mining methods.
Application of Genetic Algorithms and Data Mining in Noise-based Testing of Concurrent Software
Šimková, Hana ; Kofroň, Jan (referee) ; Lourenco, Joao (referee) ; Vojnar, Tomáš (advisor)
Tato práce navrhuje zlepšení výkonu testování programů použitím technik dolování z dat a genetických algoritmů při testování paralelních programů.  Paralelní programování se v posledních letech stává velmi populárním i přesto, že toto programování je mnohem náročnějsí než jednodušší sekvenční a proto jeho zvýšené používání vede k podstatně vyššímu počtu chyb. Tyto chyby se vyskytují v důsledku chyb v synchronizaci jednotlivých procesů programu. Nalezení takových chyb tradičním způsobem je složité a navíc opakované spouštění těchto testů ve stejném prostředí typicky vede pouze k prohledávání stejných prokládání. V práci se využívá metody vstřikování šumu, která vystresuje program tak, že se mohou objevit některá nová chování. Pro účinnost této metody je nutné zvolit vhodné heuristiky a též i hodnoty jejich parametrů, což není snadné. V práci se využívá metod dolování z dat, genetických algoritmů a jejich kombinace pro nalezení těchto heuristik a hodnot parametrů. V práci je vedle výsledků výzkumu uveden stručný přehled dalších Technik testování paralelních programů.
Data Independency of the FIT-Miner Data Mining System
Novák, Ondřej ; Šebek, Michal (referee) ; Zendulka, Jaroslav (advisor)
System for data mining Fit-Miner is now dependant on only one specific DBMS. This master’s thesis  deals with analysis of implementation that works with database, modules and functions for data mining. Next it shows the set of changes which will allow FIT-Miner to work with another DBMS. And finally, a description of the implementation of these changes.
Methods of Document Summarization on the Web
Belica, Michal ; Očenášek, Pavel (referee) ; Bartík, Vladimír (advisor)
The work deals with automatic summarization of documents in HTML format. As a language of web documents, Czech language has been chosen. The project is focused on algorithms of text summarization. The work also includes document preprocessing for summarization and conversion of text into representation suitable for summarization algorithms. General text mining is also briefly discussed but the project is mainly focused on the automatic document summarization. Two simple summarization algorithms are introduced. Then, the main attention is paid to an advanced algorithm that uses latent semantic analysis. Result of the work is a design and implementation of summarization module for Python language. Final part of the work contains evaluation of summaries generated by implemented summarization methods and their subjective comparison of the author.
Implementation of Algorithms Based on Decision Trees in C#
Grolig, Lukáš ; Pešek, Martin (referee) ; Stríž, Rostislav (advisor)
This bachelor thesis is focused on selection of data mining algorithms based on decision trees for an analytical system developed under the project System for the Internet security increase based on malware spreading analysis. Selected algorithms are described in greater detais, as well as their implementation in the C# language. These algorithms are then tested with regards to their training speed and classification accuracy. Finally, this thesis presents further conclusions and recommendations  based on performed experiments.

National Repository of Grey Literature : 74 records found   1 - 10nextend  jump to record:
Interested in being notified about new results for this query?
Subscribe to the RSS feed.