National Repository of Grey Literature 22 records found  previous11 - 20next  jump to record: Search took 0.01 seconds. 
Machine Learning Text Classifier for Short Texts Category Prediction
Drápela, Karel ; Křena, Bohuslav (referee) ; Šimková, Hana (advisor)
This thesis deals with categorization of short spam texts from SMS messages. First part summarizes current methods for text classification and~it's followed by description of several commonly used classifiers. In following chapters test data analysis, program implementation and results are described. The program is able to predict text categories based on predefined set of classes and also estimate classification accuracy on training data. For the two category types, that I designed, classifier reached accuracy of 82% and 92% . Both preprocessing and feature selection had a positive impact on resulting accuracy. It is possible to improve this accuracy further by removing portion of samples, which are difficult to classify. With 80\% recall it is possible to increase accuracy by 8-10%.
SVM classifiers and heuristics for feature selection
Krupka, Tomáš ; Holub, Martin (advisor) ; Kopa, Miloš (referee)
In machine learning applications with a large number of computer-generated features, a selection of just a subset of features is often desirable. The Recursive Feature Elimination (SVM-RFE) algorithm proposed by Guyon et al. (2002) employs the mechanism of selecting the features based on their contribution to an SVM model decision rule, and has proven a state-of-the-art performance on the Gene Selection for Cancer Classification task (Tan et al. (2010)). This thesis expands on that work, and proposes a novel modification of the SVM-RFE feature selection method called Evaluation-Based RFE (EB-RFE). This heuristic significantly improves the performance of the SVM classifier in comparison to the original SVM-RFE on the studied machine learning task. In addition to the performance gain, the proposed algorithm has also, in experimental use, proven to have two other desirable properties. Firstly, EB-RFE produces much smaller feature subsets than SVM-RFE, which leads to more compact models. Secondly, unlike SVM-RFE, the EB-RFE heuristic is easily scalable with the computational time well beyond the possibilities of current high-end consumer CPUs. Powered by TCPDF (www.tcpdf.org)
Artificial Neural Networks and Their Usage For Knowledge Extraction
Petříčková, Zuzana ; Mrázová, Iveta (advisor) ; Procházka, Aleš (referee) ; Andrejková, Gabriela (referee)
Title: Artificial Neural Networks and Their Usage For Knowledge Extraction Author: RNDr. Zuzana Petříčková Department: Department of Theoretical Computer Science and Mathema- tical Logic Supervisor: doc. RNDr. Iveta Mrázová, CSc., Department of Theoretical Computer Science and Mathematical Logic Abstract: The model of multi/layered feed/forward neural networks is well known for its ability to generalize well and to find complex non/linear dependencies in the data. On the other hand, it tends to create complex internal structures, especially for large data sets. Efficient solutions to demanding tasks currently dealt with require fast training, adequate generalization and a transparent and simple network structure. In this thesis, we propose a general framework for training of BP/networks. It is based on the fast and robust scaled conjugate gradient technique. This classical training algorithm is enhanced with analytical or approximative sensitivity inhibition during training and enforcement of a transparent in- ternal knowledge representation. Redundant hidden and input neurons are pruned based on internal representation and sensitivity analysis. The performance of the developed framework has been tested on various types of data with promising results. The framework provides a fast training algorithm,...
Feature selection for text classification with Naive Bayes
Lux, Erik ; Petříčková, Zuzana (advisor) ; Petříček, Martin (referee)
The work presents the field of document classification. It describes existing techniques with emphasis on the Naive Bayes' classifier. Several existing feature selection methods suitable for the Naive Bayes' classifier are discussed. This theoretical background is the basis for the implementation of a classification library based on the Naive Bayes' method. Besides the classification program, the library provides a range of document preprocessing tools. They allow to work with different types of documents and, more importantly, they significantly reduce redundant document dimensions. Eventually, we tested the library on two different datasets and compared implemented feature selection methods. The functionality of the whole library is practically verified by including it into the open-source email client Mailpuccino.
Study of Electrophysiological Function of the Heart in Experimental Cardiology
Ronzhina, Marina ; Tyšler, Milan (referee) ; Halámek, Josef (referee) ; Kolářová, Jana (advisor)
Srdeční poruchy, jejichž příkladem je ischemie myokardu, infarkt, hypertrofie levé komory a myokarditida, jsou v experimentální kardiologii obvykle studovány na modelu izolovaného srdce. Kritéria pro detekci srdečních poruch však nejsou pro zvířecí modely standardizována, což komplikuje srovnání a interpretaci výsledků různých experimentálních studií. Obzvlášť složitá situace nastává při současném výskytu několika patologických jevů, jejichž vzájemná součinnost komplikuje rozpoznání jejich individuálních účinků. Korektní posouzení stavu srdce vyžaduje také zohlednění mnoha faktorů spojených s akvizicí dat. Tato práce je věnována kvantitativnímu hodnocení elektrofyziologických změn způsobených globální ischemií myokardu. Vliv ischemie byl hodnocen pro fyziologická srdce a srdce se zvětšenou levou komorou a dále pro srdce nabarvená napěťově-citlivým barvivem di-4-ANEPPS. Přestože jsou oba fenomény často zastoupeny v animálních studiích, nebyl dosud popsán jejich vliv na manifestaci ischemie v elektrogramech (EG), ani nebyl kvantifikován jejich vliv na přesnost detekčních algoritmů pro identifikaci ischemie. Práce shrnuje kvantitativní změny srdeční funkce vyvolané ischemií (v normálních podmínkách, při hypertrofii levé komory, a při administraci barviva) založené na hodnocení EG a VKG parametrů. Dále práce obsahuje rozbor důležitých aspektů akvizice záznamů, jako je umístění snímacích elektrod, způsob výpočtu deskriptorů z EG a VKG (s použitím výsledků manuálního rozměření záznamů, nebo bez něj) a identifikace okamžiku vývoje ischemie v preparátu. Nedílnou součást práce tvoří návrh, realizace a ověření metod pro automatickou detekci ischemie v experimentálních záznamech. Výsledky práce dokazují, že dosažení opakovatelných a věrohodných výsledků je podmíněno zohledněním všech výše uvedených faktorů souvisejících jak se stavem srdce, tak s metodikou záznamu a analýzy dat.
Methods for class prediction with high-dimensional gene expression data
Šilhavá, Jana ; Matula, Petr (referee) ; Železný, Filip (referee) ; Smrž, Pavel (advisor)
Dizertační práce se zabývá predikcí vysokodimenzionálních dat genových expresí. Množství dostupných genomických dat významně vzrostlo v průběhu posledního desetiletí. Kombinování dat genových expresí s dalšími daty nachází uplatnění v mnoha oblastech. Například v klinickém řízení rakoviny (clinical cancer management) může přispět k přesnějšímu určení prognózy nemocí. Hlavní část této dizertační práce je zaměřena na kombinování dat genových expresí a klinických dat. Používáme logistické regresní modely vytvořené prostřednictvím různých regularizačních technik. Generalizované lineární modely umožňují kombinování modelů s různou strukturou dat. V dizertační práci je ukázáno, že kombinování modelu dat genových expresí a klinických dat může vést ke zpřesnění výsledku predikce oproti vytvoření modelu pouze z dat genových expresí nebo klinických dat. Navrhované postupy přitom nejsou výpočetně náročné.  Testování je provedeno nejprve se simulovanými datovými sadami v různých nastaveních a následně s~reálnými srovnávacími daty. Také se zde zabýváme určením přídavné hodnoty microarray dat. Dizertační práce obsahuje porovnání příznaků vybraných pomocí klasifikátoru genových expresí na pěti různých sadách dat týkajících se rakoviny prsu. Navrhujeme také postup výběru příznaků, který kombinuje data genových expresí a znalosti z genových ontologií.
Machine Learning in the Domain of Stylometry and Authorship Attribution
Drápela, Karel ; Škoda, Petr (referee) ; Smrž, Pavel (advisor)
Thesis deals with authorship attribution of english internet comments. It describes state of art in authorship attribution on social networks. It decsribes how the new system created during the work on this thesis functions. System is based on selection of most informative characteristics mostly from character n-grams and part of speech tags. It presents results of testing on comments from social networks Quora and Twitter.
Hard and soft exudates detection in retinal images
Válková, Hana ; Lamoš, Martin (referee) ; Kolář, Radim (advisor)
The thesis deals with automatic detection of soft and hard exudates in retinal images of the human eye. In its introduction the thesis describes the issue of diabetes in relation to the damage to the retina of the eye. What is described in the first place is diabetic retinopathy, its symptoms and progression of the disease. Another section is devoted to describing DIARETDB1, the freely accessible database which besides other things contains a set of images showing various degrees of disease, evaluation of images from the experts and the evaluation protocol. The next section discusses several methods for automatic detection of hard and soft exudates. The practical part of the bachelor’s thesis is aimed at image pre-processing with respect to the normalization of retinal images, the selected method for adaptive transformation of contrast was implemented. This part also containts description of chosen methology of thresholding, feature extraction based on lesions intensity and its surroundings, use of Ho Kashyap classifier is described, classification of lesions in images is followed. In conclusion realized methods is evaluated.
Feature Selection Based on Dynamic Mutual Information
Manga, Marek ; Klusáček, Jan (referee) ; Honzík, Petr (advisor)
This work analyzes and discuss a issue of implementation feature selection method called Dynamic mutual information (DMIFS). Original description of the DMIFS contains several irregularities, therefore DMIFS can not be implemented exactly as original method. Results of implemented DMIFS is compared with results of original DMIFS. This results shows that implemented DMIFS is similar to the DMIFS. Next part of the work describes design of two new methods based on the DMIFS. The first method called DmRMR merges mRMR and DMIFS. Better performance but worse stability of DmRMR was proved by several tests. The second method called WDMIFS is weighted version of the DMIFS based on AdaBoost algorithm. The WDMIFS has worse performance than DMIFS. Finnaly, manual for implementing DMIFS to RapidMiner and Weka is provided.
Analysis of phonation in patients with Parkinson's disease
Kopřiva, Tomáš ; Smékal, Zdeněk (referee) ; Mekyska, Jiří (advisor)
This work deals with analysis of phonation in patients with Parkinson’s disease (PD). Approximately 90% of patients with Parkinson’s disease suffer from speech motor dysfunction called hypokinetic dysarthria. System for Parkinson’s disease analysis from speech signals is proposed and several types of features are examined. Czech Parkinson’s speech database called PARCZ is used for classification. This dataset consists of 84 PD patients and 49 healthy controls. Results are evaluated in two ways. Firstly, features are individually analysed by Spearman correlation, mutual information and Mann-Whitney U test. Classification is based on random forests along with leave-one-out validation. Secondly, SFFS algorithm is employed for feature selection in order to get the best classification result. Proposed system is tested for each gender individually and both genders together as well. Best result for both genders together is expressed by accuracy 89,47 %, sensitivity 91,67% and specificity 85,71 %. Results of this work showed that the most important vowel realizations for phonation analysis are sustained vowels pronounced with maximum or minimum intensity (not whispering).

National Repository of Grey Literature : 22 records found   previous11 - 20next  jump to record:
Interested in being notified about new results for this query?
Subscribe to the RSS feed.