|
Knowledge Discovery from Spatio-Temporal Data
Liptáková, Daša ; Burgetová, Ivana (oponent) ; Bartík, Vladimír (vedoucí práce)
This thesis deals with knowledge discovery from spatio-temporal data. Firstly, it describes the general principles of knowledge discovery and then knowledge discovery from spatio-temporal data, where it mainly focuses on methods for detecting outlying trajectories of moving objects. In the next section, the thesis describes the design and implementation of the mining task and demonstration application. Finally, several experiments are performed over three different datasets.
|
|
Knowledge Discovery from Web Logs
Valaštín, Samuel ; Rychlý, Marek (oponent) ; Bartík, Vladimír (vedoucí práce)
This bachelor thesis deals with the problem of knowledge discovery from web logs. The data source in the form of web access logs allows, after appropriate preprocessing, the use of a number of techniques that are designed to deal with knowledge discovery. By applying these techniques to preprocessed data, it is possible to classify user behavior into groups, to discover interesting associations in user behavior, or to discover previously unknown sequences in common user behavior.
|
| |
| |
|
Metody klasifikace www stránek
Svoboda, Pavel ; Burget, Radek (oponent) ; Bartík, Vladimír (vedoucí práce)
Hlavním cílem této diplomové práce bylo prostudovat podstatné části klasifikačních metod. Práce obsahuje klíčové klasifikační metody, vysvětluje princip získávání znalostí z databází, pojem datový sklad a třídu CSSBox. Speciálně se zaměřuje na implementování hlavní metody k-nejbližších sousedů. První cílem této práce bylo vytvořit trénovací a testovací data popsaná 'n' atributy. Druhým cílem bylo experimentálně určit, jak zvolit správnou hodnotu 'k', tedy počet sousedů.
|
|
Využití získávání znalostí pro data z PDF souborů
Dvořáček, Libor ; Burgetová, Ivana (oponent) ; Bartík, Vladimír (vedoucí práce)
Bakalářská práce se zabývá extrakcí tabulek z digitálně vytvořených pdf a následným použitím získatých dat pro datovou analýzu. Použity jsou metody redukce dimenzí a shlukové analýzy. Hlavním obsahem je rozbor dostupných nástrojů pro extrakci dat v jazyce python, popis a porovnání použitých metod strojového učení a implementace aplikace, která všechna tato témata sdružuje do jednoho funkčního celku na adrese: http://extraktor.herokuapp.com
|
|
Modul pro dolování v časových řadách systému pro dolování z dat
Klement, Ondřej ; Bartík, Vladimír (oponent) ; Zendulka, Jaroslav (vedoucí práce)
Předmětem této diplomové práce je rozšíření funkcionality existujícího systému pro dolování z dat. Systém bude rozšířen o modul pro dolování dat z časových řad. Práce se skládá z obecného úvodu do problematiky dolování z dat a pokračuje pojednáním o časových řadách. Práce obsahuje rozbor některých současných úloh a popis algoritmů, používaných při dolování dat z časových řad. Následuje koncepce implementace nového modulu a popis konkrétní dolovací metody. V závěru práce jsou navržena i další možná rozšíření aktuálního systému.
|
| |
|
Získávání znalostí pro modelování následných akcí
Veselovský, Martin ; Burget, Radek (oponent) ; Bartík, Vladimír (vedoucí práce)
Získavanie znalostí z databáz je komplexný problém zahrňujúci integráciu, prípravu dát, dolovanie znalostí metódami strojového učenia a vizualizáciu výsledkov. Práca pojednáva o celom procese získavania znalostí, špeciálne o problematike budovania dátových skladov, kde prináša návrh a implementáciu dátového skladu pre spoločnosť ROI Hunter, a.s. V oblasti dolovania z dát sa práca zameriava na klasifikáciu a predikciu reklamných dát dostupných z pripraveného dátového skladu, a to predovšetkým klasifikáciou rozhodovacím stromom. Pri predikcii vývoja nových reklám sa kladie dôraz na zdôvodnenie predikcie ako aj na návrh pre úpravu nastavení reklamy tak, aby predikcia skončila pozitívne, a teda aby s istou pravdepodobnosťou reklama v skutočnosti získala lepšie výsledky.
|
|
Dolování víceúrovňových asociačních pravidel
Nachtnebl, Viktor ; Stryka, Lukáš (oponent) ; Bartík, Vladimír (vedoucí práce)
Obor získávání znalostí z dat je poměrně mladý a stále více se rozvíjí. Tato bakalářská práce se zabývá problematikou dolování víceúrovňových asociačních pravidel. Diskutovány jsou čtyři metody dolování těchto pravidel. Dále nabízí náhled do návrhu a implementace aplikace. V závěru jsou pak porovnány a zhodnoceny výsledky všech čtyřech algoritmů.
|