Národní úložiště šedé literatury Nalezeno 22 záznamů.  předchozí11 - 20další  přejít na záznam: Hledání trvalo 0.00 vteřin. 
Predikce povahy spamových krátkých textů textovým klasifikátorem
Drápela, Karel ; Křena, Bohuslav (oponent) ; Šimková, Hana (vedoucí práce)
Práce se zabývá kategorizací krátkých spamových textů v SMS zprávách. V první části práce jsou shrnuty aktuální přístupy k textové klasifikaci a následuje popis nejpoužívanějších klasifikátorů. V dalších kapitolách je rozebrána anotace testovacích dat, implementace programu a výsledky klasifikace. Program je schopen klasifikovat texty na základě definovaných kategorií a také odhadnout přesnost klasifikátoru na trénovací sadě. Pro dva navržené typy kategorií dosahuje klasifikátor přesnosti až 82% a 92%. Předzpracování i výběr příznaků měly na přesnost pozitivní vliv. Přesnost je dále možné zvýšit odstraněním části vzorků, které má klasifikátor největší problémy zařadit. Při 80% pokrytí je možné zvýšit přesnost o 8-10%.
SVM classifiers and heuristics for feature selection
Krupka, Tomáš ; Holub, Martin (vedoucí práce) ; Kopa, Miloš (oponent)
V aplikacích strojového učení s velkým množstvím počítačem vytvářených příznaků je často zapotřebí užít pouze jejich malou podmnožinu. Algoritmus "Recursive Feature Elimination" (SVM-RFE) publikovaný v práci Guyon et al. (2002), který vybírá příznaky na základě jejich váhy v SVM modelu, prokázal na úloze výběru genů pro klasifikaci leukemie do té doby nepřekonanou výkonnost (Tan et al. (2010)). Tato práce rozvíjí tuto metodu a předkládá novou modifikaci algoritmu SVM-RFE nazvanou Evaluation-Based RFE (EB-RFE). Ve srovnání s původním algoritmem SVM-RFE tato heuristika významně zvedá výkonnost výsledného SVM klasifikátoru na studované úloze strojového učení. Experimenty navíc ukazují, že tato nová heuristika má další dvě žádoucí vlastnosti. Za prvé, EB-RFE generuje výrazně menší podmnožíny příznaků, čímž umožňuje trénovat kompaktnější modely. Za druhé, heuristika EB-RFE je narozdíl od originálního algoritmu SVM-RFE jednoduše škálovatelná v závislosti na výpočetním čase, a to výrazně nad možnosti současných nejvýkonnějších běžných počítačů. Powered by TCPDF (www.tcpdf.org)
Artificial Neural Networks and Their Usage For Knowledge Extraction
Petříčková, Zuzana ; Mrázová, Iveta (vedoucí práce) ; Procházka, Aleš (oponent) ; Andrejková, Gabriela (oponent)
Název práce: Umělé neuronové sítě a jejich využití při extrakci znalostí Autor: RNDr. Zuzana Petříčková Katedra: Katedra teoretické informatiky a matematické logiky Vedoucí disertační práce: doc. RNDr. Iveta Mrázová, CSc., Katedra teo- retické informatiky a matematické logiky Abstrakt: Vrstevnaté neuronové sítě jsou známé především díky své schopnosti dobře zobecňovat a odhalit v datech i složité nelineární závislosti. Na druhé straně má tento model tendenci vytvářet poměrně složitou vnitřní strukturu, a to především pro rozsáhlé datové sady. Při efektivním řešení náročných úloh jsou proto kladeny vysoké nároky především na rychlost procesu učení, schopnost sítě zobecňovat a na vytvoření jednoduché a transparentní struktury modelu. V této práci jsme navrhli obecnou metodologii pro učení vrstevnatých neuro- nových sítí. Jejím základem je rychlá a robustní metoda škálovaných konjugo- vaných gradientů. Tento standardní algoritmus učení je rozšířen o analytické či aproximativní oslabování citlivosti a o vynucovaní kondenzované interní re- prezentace. Redundantní vstupní a skryté neurony jsou prořezávány pomocí technik založených na citlivostní analýze a interní reprezentaci znalostí....
Feature selection for text classification with Naive Bayes
Lux, Erik ; Petříčková, Zuzana (vedoucí práce) ; Petříček, Martin (oponent)
Tato práce se zabývá výzkumem v oblasti klasifikace dokumentů. Popisuje již existujici techniky s důrazem na Naivní Bayesův klasifikátor. Zmíněny jsou i některé z metod pro výběr příznaků. Teoretické pozadí je základem pro implementaci klasifikační knihovny založené na metodě Naivního Bayesovského klasifikátoru. Knihovna poskytuje kromě samotného klasifikátoru i paletu nástrojů pro předzpracování textu. Tyto nástroje umožňují práci s rozličným typem dokumentů, ale především značně snižují nadbytečné dimenze vstupních dat. Knihovna je testována na dvou různych referenčních datových sadách na kterých jsou diskutovány rozdíly chování jednotlivých metod pro výběr příznaků. Funkčnost celé knihovny je prakticky ověřena jejím začleněním do open-source emailového klienta Mailpuccino.
Study of Electrophysiological Function of the Heart in Experimental Cardiology
Ronzhina, Marina ; Tyšler, Milan (oponent) ; Halámek, Josef (oponent) ; Kolářová, Jana (vedoucí práce)
Isolated heart is widely used in experimental cardiology to study myocardial ischemia and infarct, left ventricular hypertrophy, myocarditis, etc. Nevertheless, the standardized criteria for assessment of above disorders in animal models are missing that complicates interpretation of the results obtained in such studies. It is of special importance, if several pathologies are presented simultaneously, when possible co-effects cannot be simply identified and analysed. Besides the condition of the heart, there are many other factors playing important role in data acquisition and analysis. In this work, electrophysiological effects of increased left ventricular mass (intrinsic factor) and voltage-sensitive dye di-4-ANEPPS (external factor) are evaluated on rabbit isolated hearts under non-ischemic and ischemic condition. Although both phenomena are quite frequent in animal studies, their effects on ischemia manifestations and electrogram-based ischemia detection accuracy have not been quantitatively described yet. Results of quantification of ischemia-induced changes in heart function (under normal conditions, increased LV or dye administration) by analysis of various EG and VCG parameters are summarized. Such important aspects as recording electrodes placement, method of parameters calculation (using or without outcomes of manual EG delineation) and definition of the beginning of ‘true’ ischemic injury in preparation (methodological factors) are also addressed. Along with it, different tools for automatic detection of ischemia in data are presented. According to the results of statistical analysis of parameters and testing the detectors on different data, all above mentioned phenomena (both heart-related and methodological) should be taken into account to ensure successful study of the heart electrical activity.
Methods for class prediction with high-dimensional gene expression data
Šilhavá, Jana ; Matula, Petr (oponent) ; Železný, Filip (oponent) ; Smrž, Pavel (vedoucí práce)
This thesis deals with class prediction with high-dimensional gene expression data. During the last decade, an increasing amount of genomic data has become available. Combining gene expression data with other data can be useful in clinical management, where it can improve the prediction of disease prognosis. The main part of this thesis is aimed at combining gene expression data with clinical data. We use logistic regression models that can be built through various regularized techniques. Generalized linear models enable us to combine models with different structure of data. It is shown that such a combination may yield more accurate predictions than those obtained based on the use of gene expression or clinical data alone. Suggested approaches are not computationally intensive. Evaluations are performed with simulated data sets in different settings and then with real benchmark data sets. The work also characterizes an additional predictive value of microarrays. The thesis includes a comparison of selected features of gene expression classifiers built up in five different breast cancer data sets. Finally, a feature selection that combines gene expression data with gene ontology information is proposed.
Strojové učení v oblasti stylometrie a určování autorství
Drápela, Karel ; Škoda, Petr (oponent) ; Smrž, Pavel (vedoucí práce)
Práce se zabývá identifikací autorů anglických internetových komentářů. Popisuje aktuální stav v oboru určování autorství na sociálních sítích. Vysvětluje fungování a strukturu vytvořeného systému na určování autorství, který funguje na základě výběru nejinformativnějších příznaků z převážně písmemnných n-gramů a slovních druhů. Prezentuje výsledky testování systému na internetových službách Quora a Twitter.
Detekce měkkých a tvrdých exudátů ve snímcích sítnice
Válková, Hana ; Lamoš, Martin (oponent) ; Kolář, Radim (vedoucí práce)
Tato práce se zabývá automatizovanou detekcí měkkých a tvrdých exudátů ve snímcích sítnice lidského oka. Práce v úvodu popisuje problematiku diabetu v souvislosti s poškozením sítnice oka. Především je popsána diabetická retinopatie, její projevy a postup onemocnění. Další část je věnována popisu volně přístupné databáze DIARETDB1, která obsahuje mimo jiné sadu snímků s různým stupněm onemocnění, hodnocení snímků od expertů a vyhodnocovací protokol. V další části pojednává o několika metodách automatické detekce tvrdých a měkkých exudátů. Praktická část bakalářské práce je zaměřena na vytvoření metody pro detekci exudátů. Metoda sestává z předzpracování, byla realizována vybraná metoda pro adaptivní transformaci kontrastu. Dále obsahuje popis zvolené metodiky prahování, výběr příznaků na základě intenzity lézí a jejich okolí, použití klasifikátoru Ho Kashyap s následnou klasifikaci lézí v obrazech. Závěrem je provedeno zhodnocení realizované metody.
Výběr příznaků metodou Dynamická vzájemná informace
Manga, Marek ; Klusáček, Jan (oponent) ; Honzík, Petr (vedoucí práce)
V této práci je proveden rozbor a diskutována problematika implementace metody pro výběr příznaků s názvem Dynamická vzájemná informace (DMIFS). Při studiu popisu DMIFS bylo nalezeno několik nesrovnalostí, které neumožňují úplně napodobit původní algoritmus, proto výsledky DMIFS implementované v rámci této práce byly porovnány s výsledky z článku, kde byla DMIFS publikována. Bylo zjištěno, že implementovaná DMIFS dosahuje podobných výsledků, jako metoda původní. Dále se práce zabývá návrhem dvou nových metod vycházejících z principu DMIFS. První metoda s názvem DmRMR vznikla spojením mRMR a DMIFS. Provedené testy potvrzují lepší výkonnost DmRMR, než jakou má DMIFS je ale méně stabilní. Druhá metoda s názvem WDMIFS je váhovanou variantou DMIFS fungující na bázi AdaBoost. U této metody nedošlo ke zlepšení výkonu. Na závěr je vypracován návod pro implementaci DMIFS do prostředí Weka a RapidMiner.
Analýza fonace u pacientů s Parkinsonovou nemocí
Kopřiva, Tomáš ; Smékal, Zdeněk (oponent) ; Mekyska, Jiří (vedoucí práce)
Tato práce se zabývá analýzou fonace u pacientů s Parkinsonovou nemocí (PN). Přibližně 90% pacientů s Parkinsonovou nemocí trpí motorickou poruchou řeči nazývanou hypokinetická dysartrie. Je navržen systém pro rozpoznání Parkinsonovy nemoci z řečových signálů a je otestováno několik typů příznaků. Pro klasifikaci je použita česká řečová databáze pacientů s Parkinsonovou nemocí PARCZ. Obsahuje 84 pacientů s PN a 49 zdravých kontrolních řečníků. Výsledky jsou vyhodnoceny dvěma způsoby. Nejprve jsou příznaky analyzovány jednotlivě Spearmanovým korelačním testem, vzájemnou informací a Mann-Whitneyho U testem. Klasifikace je založena na náhodných stromech společně s validací leave-one-out. V druhém kroku je použit algoritmus výběru příznaků SFFS pro dosažení co nejlepšího výsledku klasifikace. Navržený systém je otestován pro jednotlivá pohlaví zvlášť i dohromady. Nejlepší výsledek pro obě pohlaví dohromady vyjadřuje přesnost klasifikace 89,47 %, sensitivita 91,67% a specificita 85,71 %. Výsledky práce ukázaly, že pro analýzu fonace mají největší význam dlouhé realizace vokálů vyslovené s maximální nebo minimální intenzitou (ne šeptem).

Národní úložiště šedé literatury : Nalezeno 22 záznamů.   předchozí11 - 20další  přejít na záznam:
Chcete být upozorněni, pokud se objeví nové záznamy odpovídající tomuto dotazu?
Přihlásit se k odběru RSS.