keywords:"clustering" - Výsledky hledání - Digitální repozitář

host :: přihlásit Digitální repozitář
		Hledej		Nový záznam		Nápověda		O repozitáři

Hlavní stránka > Výsledky hledání: keywords:"clustering"

Hledej:



Tipy pro vyhledávaní :: Jednoduché hledání

Hledej ve sbírkách:

Seřadit podle:	Zobrazit výsledky:	Výstupní formát:

	Multi-Criteria Clustering of Files Jasnický, Matúš ; Jeřábek, Kamil (oponent) ; Zobal, Lukáš (vedoucí práce) This work aims to create the clustering part of a new version of the clustering tool named Clusty, which is developed by Avast Software. Clusty is a tool for automatic analysis and online clustering of all incoming samples. The most notable shortcomings are using a single criterion for clustering, vertical scalability, and lack of support for achieving high availability. Among the good features belong a good performance, interpretability of clusters' origin, and an ability to use other techniques like YARA rules. The designed tool overcome the shortcomings while keeping the features. None of the existing clustering methods is being used because none of them had satisfied the requirements. Instead, three new methods are proposed. They are based on the method in the current version of Clusty and the standard methods. The tool uses so-called rules to allow using multiple clustering methods concurrently. The clustering results can be considered better compared to the results from the current version. This work proposes a solution for the shortcomings and shows the usable clustering methods. Úplný záznam
	Detekce a reprezentace hran v mračnech bodů Večeřová, Alena ; Druckmüllerová, Hana (oponent) ; Procházková, Jana (vedoucí práce) Tato práce se zabývá detekcí a vhodnou reprezentací hran v mračnech bodů. Pro detekci hranových bodů je využita metoda clusterování normál. Při reprezentaci přímkových hran je využita metoda RANSAC. V rámci práce jsou hranové body jednoho modelu proloženy i kružnicí za využití metody nejmenších čtverců a zobrazení v projektivním prostoru. Všechny metody byly implementovány v programu MATLAB a byly otestovány na reálných datech získaných na skeneru ATOS CompactScan 2M. Úplný záznam
	Road Transport Analysis Using Neural Networks Žárský, Daniel ; Musil, Petr (oponent) ; Smrž, Pavel (vedoucí práce) The aim of this bachelor thesis is to simplify the analysis of road traffic using camera recordings by providing a mean for automatic scene annotation. The thesis describes the general technical principles used in a traffic monitoring camera system and proposes a procedure for processing the data obtained by computer vision methods with the aim of automated deployment of the system. The subsequent data processing uses clustering algorithms to identify and locate the main directions of movement of traffic participants. Based on these results, the scene is automatically annotated. The scene annotation can be used as the basis for later real-time detection of traffic anomalies. Úplný záznam
	Multi-label klasifikace textových dokumentů Průša, Petr ; Očenášek, Pavel (oponent) ; Bartík, Vladimír (vedoucí práce) Diplomová práce se zabývá automatickou klasifikací textových dokumentů. Jsou zde vysvětleny základní pojmy a problémy dolování z textu. Práce vysvětluje pojem shlukování a ukazuje několik základních algoritmů shlukování. Je zde ukázáno i několik metod klasifikace a podrobně je rozebrána vybraná metoda matrix regression. Dále byla navrhnuta a implementována aplikace používající ke klasifikaci matrix regression. Provedené experimenty byly zaměřeny na normalizaci a prahování. Úplný záznam
	Knowledge Discovery from Time Series Krutý, Peter ; Burget, Radek (oponent) ; Bartík, Vladimír (vedoucí práce) This thesis is focused on the field of knowledge discovery from data, specifically from time series. Main objective is to research Python programming language support in this area and then design and implement an application that will allow to demonstrate and compare selected methods. Methods are demonstrated in experiments using appropriate data set. The output of the thesis is a comparison of methods for specific tasks and the application implementing selected methods. Úplný záznam
	Shlukování textových dat Leixner, Petr ; Burgetová, Ivana (oponent) ; Bartík, Vladimír (vedoucí práce) Proces shlukování textových dat slouží pro analýzu, navigaci a strukturování velkých kolekcí textů nebo hypertextových dokumentů. Úkolem shlukování je rozklad množiny dokumentů do shluků na základě jejich podobnosti. Nejznámější metody z této oblasti dolování však neřeší specifické problémy textového shlukování, jako vysokou dimenzionalitu vstupních dat, velmi velkou velikost databází a srozumitelnost popisu shluků. Tato práce se zabývá uvedenou problematikou a popisuje moderní metodu shlukování textových dat založenou na použití frekventovaných množin termů, která se svým přístupem snaží řešit nedostatky jiných shlukovacích metod. Úplný záznam
	Algoritmy pro shlukování textových dat Sedláček, Josef ; Burget, Radim (oponent) ; Karásek, Jan (vedoucí práce) Tato diplomová práce se zabývá problematikou dolování textových dat. Je zde popsána teorie potřebná ke shlukování textových dokumentů a také algoritmy, které se při shlukování využívají. Podle této teorie je pak vytvořena aplikace pro shlukování textových dat. Aplikace je vytvořena v programovacím jazyku Java a obsahuje tři metody používané při shlukování. Uživatel si tak sám může vybrat metodu, podle které chce kolekci dokumentů shlukovat. Implementované metody jsou K medoids, BiSec K medoids a SOM (self organization map). Součástí aplikace je také vytvoření validační množiny, pomocí které jsou algoritmy testovány. V závěru jsou pak algoritmy porovnány podle dosažených výsledků. Úplný záznam
	Analýza dat z mikročipů pro zjišťování genové exprese Hebelka, Tomáš ; Jaša, Petr (oponent) ; Burgetová, Ivana (vedoucí práce) Práce se zabývá analýzou dat z DNA mikročipů pomocí shlukové analýzy. Vysvětluje biologické pojmy - genová exprese a DNA mikročip. Následně obsahuje matematický a informatický popis metod shlukování a popisuje, jak tyto metody aplikovat na data z mikročipů. Dále práce obsahuje implementační detaily shlukovacích metod k-means, DBSCAN a představuje originální shlukovací algoritmus Strom++. Poté následuje popis implementace a ovládání programu. Na konec jsou zhodnoceny dosažené výsledky. Úplný záznam
	Detekce a sledování objektů pomocí význačných bodů Bílý, Vojtěch ; Hradiš, Michal (oponent) ; Juránek, Roman (vedoucí práce) Tato práce se zabývá detekcí a sledováním objektů pomocí význačných bodů. Jsou zde popsány existující přístupy k této problematice. Je zde navržená inovovaná metoda detekce objektů založená na Obecné Houghově transformaci a iterativním prohledáváním Houghova prostoru. Na nejrůznějších typech objektu je demonstrována univerzálnost navrženého detektoru. Sledování objektů je řešeno detekcí objektu snímek po snímku. Úplný záznam
	Unsupervised Evaluation of Speaker Recognition System Odehnal, Ondřej ; Plchot, Oldřich (oponent) ; Matějka, Pavel (vedoucí práce) The context of this thesis is the state-of-the-art system for speaker identification (SID) based on the deep nerual network with x-vector embeddings. This thesis aims to propose and experimentally assess several techniques for evaluating the SID system using unlabelled datasets. For this purpose, discriminative embedding is created for every recording in the dataset. These embeddings are used to cluster the recordings and thus create pseudo-labels corresponding to different clusters. The SID system evaluation is based on equal error rate (EER), which uses these pseudo-labels. We proposed several unsupervised learning algorithms to achieve this; K-means, Gaussian mixture models (GMM), and agglomerative hierarchical clustering (AHC). After thorough testing, the K-means model with the Silhouette value showed the best results. This method achieved an estimate of 5.72 % EER with the reference EER equal to 5.15 % on SITW dev-core-core. Similar results were observed on the SITW eval-core-core, where the estimated EER is equal to 5.86 % and the reference 5.08 %. The difference between estimated and reference EER is 0.57 % for the dev-core-core and 0.78 % for the eval-core-core. Another series of experiments were conducted on NIST SRE16 and VoxCeleb1 to verify robustness of the proposed method. Generally, the developed testing process had an estimated error of around 1 % in all test databases, an excellent result for an unsupervised learning technique. Úplný záznam

Chcete být upozorněni, pokud se objeví nové záznamy odpovídající tomuto dotazu?
Přihlásit se k odběru RSS.

Digitální repozitář :: :: :: ::
Powered by v1.1.2
Spravuje

Tato stránka je dostupná také v následujících jazycích:
Česky English