Národní úložiště šedé literatury Nalezeno 11 záznamů.  1 - 10další  přejít na záznam: Hledání trvalo 0.00 vteřin. 
Classifier of astrophysics data
Rylko, Vojtěch ; Vrábelová, Pavla (oponent) ; Zendulka, Jaroslav (vedoucí práce)
This bachelor thesis describes selection, design and implementation of a data mining algoritm for astrophysical usage.     The implementation of the random decision forests algorithm in C++ is evaluated on two astrophysical and some general experiments. Experiments are both classification and regression with time measuring. For comparison another three implementations are evaluated.     The resulting implementation shows good results mainly in classification.
Statistical models for prediction of project duration
Oberta, Dušan ; Žák, Libor (oponent) ; Hübnerová, Zuzana (vedoucí práce)
The aim of this thesis is to introduce statistical models suitable for data analysis and apply them on real data related to time duration of projects based on characteristics of given projects. In the first chapter, linear regression models based on the least squares method are studied, including their properties and prediction intervals. The next chapter deals with the problematics of generalized linear models, which are based on the maximum likelihood estimation principle. Also basic properties of generalized linear models and asymptotic confidence intervals for expected values are described. In the next chapter, regression trees are introduced, with two methods of growing the trees, namely least squares and maximum likelihood estimation. Also basic principles of pruning the trees and confidence intervals for expected values were described. Derivation of maximum likelihood estimation for regression trees and confidence intervals are to a great extent own work of the author. The last described models are random forests, including their basic properties and confidence intervals for expected values. Throughout these chapters, methods for assessing model's quality, selection of optimal submodel and finding optimal values for tuning parameters were also described. At the end, the studied models and algorithms are implemented in Python and applied on real data.
Spatial Analysis of Czech Parliamentary Election: Comparison of Spatial Econometrics and Machine Learning
Černý, Jakub ; Šťastná, Lenka (vedoucí práce) ; Gregor, Martin (oponent)
Práce analyzuje výsledky voleb do Poslanecké sněmovny Parlamentu ČR z roku 2021 a snaží se vysvětlit voličskou podporu významných politických subjektů za použití agregovaných dat z obcí ČR. Protože data vykazují prostorovou autokorelaci, je nutné k analýze použít vhodný prostorový model. Práce poskytuje empirické i ekonomické důkazy ve prospěch Spatial Durbin Error modelu, který umožňuje rozlišovat přímé a nepřímé efekty jednotlivých proměnných a bere v potaz i prostorovou závislost reziduí. Tato metoda ukazuje, že proměnné popisující socio-ekonomickou úroveň obyvatelstva, jako např. podíl podnikatelů nebo lidí s vysokoškolským vzděláním, hrají důležitou roli při vysvětlování volebních výsledků a převážně vykazují přímé efekty. Naopak, proměnné obecně popisující obce, jako např. veřejné výdaje nebo úroveň infrastruktury, ovlivňují volební výsledky spíše nepřímo. Následně je analýza replikována pomocí dvou algoritmů strojového učení na principu rozhodovacích stromů a všechny modely jsou porovnány na základě jejich schopnosti předpovídat volební výsledek z neznámých dat. Navzdory skutečnosti, že metody strojového učení neodhadují koeficienty k jednotlivým proměnným, ale pouze jejich relativní důležitost, představuje tento přístup perspektivní doplněk k oboru prostorových analýz.
Modern regression methods in data mining
Kopal, Vojtěch ; Holeňa, Martin (vedoucí práce) ; Gemrot, Jakub (oponent)
Tato práce porovnává nelineární regresní metody na umělých datech vytvořených po- mocí standardních testovacích funkcí pro spojité black-box optimalizace. Pro toto srovnání jsme vybrali následující regresní metody: sítě s bázemi tvořenými radiálními funkcemi, Gaussovské procesy, regresi založenou na opěrných vektorech a náhodné lesy. Metody jsou porovnány v kontextu problémů black-box optimalizace, kde se právě tyto metody používají jako náhradní modely. Metody jsou vyhodnoceny na základě střední kvadratické chyby a na základě Kendallova koeficientu mezi pořadím funkčních hodnot podle modelu a podle funkce, která byla použita k vygenerování dat. 1
Comparison of statistical methods for the scoring models development
Mrázková, Adéla ; Vitali, Sebastiano (vedoucí práce) ; Kopa, Miloš (oponent)
Cílem práce je představit a shrnout obecný postup vývoje skóringového modelu a základních statistických přístupů používaných k řešení tohoto problému, konkrétně metody logistické regrese, neuronové sítě a rozhodovací stromy (náhodné lesy). Následuje aplikace popsaných metod na reálných datech poskytnutých společností PROFI CREDIT Czech, a.s., včetně diskuze některých implementačních otázek a jejich řešení. Obdržené výsledky jsou diskutovány a porovnávány.
Využití statistických metod při oceňování nemovitostí
Funiok, Ondřej ; Pecáková, Iva (vedoucí práce) ; Řezanková, Hana (oponent)
Diplomová práce se zabývá oceňováním nemovitostí v České republice za pomocí statistických metod. Práce se zaměřuje komplexní úlohu založenou na datech z inzertního webového portálu. Cílem diplomové práce je vytvoření prototypu statistického predikčního modelu pro oceňování obytných nemovitostí v Praze a jeho vyhodnocení pro další možnosti rozšiřování. Struktura práce je koncipovaná podle metodiky CRISP-DM. Na předzpracovaných datech jsou postupně vyzkoušeny metody regresních stromů a náhodných lesů, pomocí kterých je predikována cena nemovitostí.
Parallel Processing of Huge Astronomical Data
Haas, František ; Zavoral, Filip (vedoucí práce) ; Kruliš, Martin (oponent)
Diplomová práce se zabývá analýzou a implementací algoritmu náhodných lesů. Náhodné lesy jsou algoritmem strojového učení pro klasifikaci dat. Cílem práce je implementace náhodných lesů pomocí technologií paralelního programování pro CPU a GPGU a referenční sériové implementace pro CPU. Dále pak porovnání a vyhodnocení výkonnosti a přesnosti těchto implementací na různých hardwarových platformách. Pro porovnání implementací budou použity různé datové soubory, důraz bude kladen na reálná astronomická data získaná z pozorování stelárních spekter. Bude posouzena vhodnost užití algoritmů náhodných lesů pro klasifikaci stelárních spekter jak z funkčního tak výkonnostního hlediska. Powered by TCPDF (www.tcpdf.org)
Artificial Intelligence Approach to Credit Risk
Říha, Jan ; Baruník, Jozef (vedoucí práce) ; Vošvrda, Miloslav (oponent)
Tato práce se zabývá aplikaci umělé inteligence v řízení kreditního rizika. Tento moderní přístup je porovnán s aktuálním standardem trhu, s logistickou regresí. V práci prezentujeme teorii zaměřenou na neuronové sítě, podpůrné vektorové stroje, náhodné lesy a logistickou regresi. Také se zabýváme metodologií na vyhodnocení a porovnávání těchto modelů ze statistického a obchodního hlediska. Zjistili jsme, že modely z kategorie neuronových sítí, zejména Multi-Layer Perceptron a Radial Basis Function Network, překonávají logistickou regresi ve standardních statistických a obchodních kritériích. Výkonnost náhodných lesů a podpůrných vektorových strojů není dostatečná a v naší práci jejich výkonnost nedosahovala výkonnosti logistické regrese.
Modern regression methods in data mining
Kopal, Vojtěch ; Holeňa, Martin (vedoucí práce) ; Gemrot, Jakub (oponent)
Tato práce porovnává nelineární regresní metody na umělých datech vytvořených po- mocí standardních testovacích funkcí pro spojité black-box optimalizace. Pro toto srovnání jsme vybrali následující regresní metody: sítě s bázemi tvořenými radiálními funkcemi, Gaussovské procesy, regresi založenou na opěrných vektorech a náhodné lesy. Metody jsou porovnány v kontextu problémů black-box optimalizace, kde se právě tyto metody používají jako náhradní modely. Metody jsou vyhodnoceny na základě střední kvadratické chyby a na základě Kendallova koeficientu mezi pořadím funkčních hodnot podle modelu a podle funkce, která byla použita k vygenerování dat. 1
Construction of classifiers suitable for segmentation of clients
Hricová, Jana ; Antoch, Jaromír (vedoucí práce) ; Zvára, Karel (oponent)
Název práce: Metody konstrukce klasifikátorů vhodných pro segmentaci zákaz- níků Autor: Bc. Jana Hricová Katedra: Katedra pravděpodobnosti a matematické statistiky Vedoucí diplomové práce: prof. RNDr. Jaromír Antoch, CSc., Katedra pravděpo- dobnosti a matematické statistiky Abstrakt: Diplomová práce pojednává o metodách, které jsou součástí široké ob- lasti analýzy dat, zvané klasifikace. V rámci klasifikačních metod jsou v práci představeny metody vhodné pro segmentaci zákazníků, které konstruují klasifiká- tory stromového typu. Podrobně je představena metodologie CART (Klasifikační a regresní stromy) a skupinové modely, vhodné pro konstrukci klasifikačních a re- gresních lesů, jmenovitě Bagging, Boosting, Arcing a Random Forest. Popsané metody byly použity na reálná data z oblasti segmentace zákazníků a na simulované data v prostředí programu RStudio. Klíčová slova: klasifikace, klasifikátory stromového typu, náhodné lesy

Národní úložiště šedé literatury : Nalezeno 11 záznamů.   1 - 10další  přejít na záznam:
Chcete být upozorněni, pokud se objeví nové záznamy odpovídající tomuto dotazu?
Přihlásit se k odběru RSS.