Original title:
Využití fuzzy množin ve shlukové analýze se zaměřením na metodu Fuzzy C-means Clustering
Translated title:
Fuzzy Sets Use in Cluster Analysis with a Special Attention to a Fuzzy C-means Clustering Method
Authors:
Camara, Assa ; Popela, Pavel (referee) ; Žák, Libor (advisor) Document type: Master’s theses
Year:
2020
Language:
cze Publisher:
Vysoké učení technické v Brně. Fakulta strojního inženýrství Abstract:
[cze][eng]
Táto práca sa zaoberá zhlukovou analýzou, a podrobnejšie zhlukovacími metódami, ktoré používajú fuzzy množiny. V teoretickej časti sú popísané zhlukovacie metódy a transformácie potrebné na zhlukovú analýzu. V praktickej časti aplikujeme na reálne dáta. Tieto dáta predstavujú vstupné dáta z chemicko-transportného modelu CMAQ, ktorý sa používa na získanie výpočtu koncentrácii znečisťujúcich látok v atmosfére. Na tieto dáta aplikujeme dve rôzne metódy, metódu k-means a fuzzy c-means. Pre metódu fuzzy c-means porovnáva dva rôzne prístupy k zvoleniu optimálneho váhového exponentu. Porovnali sme takto vytvorené 3 zhlukovacie štruktúry. Výsledné zhluky si boli podobné a však metóda fuzzy c- means s vyššiu hodnotou váhového exponentu vytvorila zhluky, ktoré nemali žiadnu podobnosť so zhlukovanými veličinami. V závere sme vytvorili regresný model na nájdenie vzťahu medzi vstupnými a výstupnými dátami modelu CMAQ.
This master thesis deals with cluster analysis, more specifically with clustering methods that use fuzzy sets. Basic clustering algorithms and necessary multivariate transformations are described in the first chapter. In the practical part, which is in the third chapter we apply fuzzy c-means clustering and k-means clustering on real data. Data used for clustering are the inputs of chemical transport model CMAQ. Model CMAQ is used to approximate concentration of air pollutants in the atmosphere. To the data we will apply two different clustering methods. We have used two different methods to select optimal weighting exponent to find data structure in our data. We have compared all 3 created data structures. The structures resembled each other but with fuzzy c-means clustering, one of the clusters did not resemble any of the clustering inputs. The end of the third chapter is dedicated to an attempt to find a regression model that finds the relationship between inputs and outputs of model CMAQ.
Keywords:
air quality.; Cluster analysis; CMAQ; fuzzy c-means clustering; k-means clustering; weighing exponent; CMAQ; kvalita ovzdušia.; váhový exponent; zhlukovanie fuzzy c-means; zhlukovanie k-means; Zhluková analýza
Institution: Brno University of Technology
(web)
Document availability information: Fulltext is available in the Brno University of Technology Digital Library. Original record: http://hdl.handle.net/11012/192280