Original title:
Dynamická faktorová analýza časových řad
Translated title:
Time series dynamic factor analysis
Authors:
Slávik, Ľuboš ; Michálek, Jaroslav (referee) ; Hübnerová, Zuzana (advisor) Document type: Master’s theses
Year:
2021
Language:
eng Publisher:
Vysoké učení technické v Brně. Fakulta strojního inženýrství Abstract:
[eng][cze]
Táto diplomová práca sa zaoberá novým prístupom k zhlukovaniu časových rád na základe dynamického faktorového modelu. Dynamický faktorový model je technika redukujúca dimenziu a rozširuje klasickú faktorovú analýzu o požiadavku autokorelačnej štruktúry latentných faktorov. Parametre modelu sa odhadujú pomocou EM algoritmu za použitia Kalmanovho filtra a vyhladzovača a taktiež sú aplikované nevyhnutné podmienky na model, aby sa stal identifikovateľným. Po tom, ako je v práci predstavený teoretický koncept prístupu, dynamický faktorový model je aplikovaný na skutočné pozorované časové rady a práca skúma jeho správanie a vlastnosti na jednomesačných meteorologických dátach požiarneho indexu (Fire Weather Index) na 108 požiarnych staniciach umiestnených v Britskej Kolumbii. Postup výpočtu modelu odhadne záťažovú maticu (loadings matrix) spolu so zodpovedajúcim malým počtom latentných faktorov a kovariačnou maticou modelovaných časových rád. Diplomová práca aplikuje k-means zhlukovanie na výslednú záťažovú maticu a ponúka rozdelenie meteorologických staníc do zhlukov založené na redukovanej dimenzionalite pôvodných dát. Vďaka odhadnutým priemerom zhlukov a odhadnutým latentným faktorom je možné získať aj priemerné trendy každého zhluku. Následne sú dosiahnuté výsledky porovnané s výsledkami získanými na dátach z rovnakých staníc avšak iného mesiaca, aby sa stanovila stabilita zhlukovania. Práca sa taktiež zaoberá efektom varimax rotácie záťažovej matice. Diplomová práca naviac navrhuje metódu detekovania odľahlých časových rád založenú na odhadnutej kovariačnej matici modelu a rozoberá dôsledky odľahlých hodnôt na odhanutý model.
This thesis studies a novel approach to time series clustering based on a dynamic factor model. Dynamic factor model is a dimension reduction technique enhancing classical factor analysis by a requirement of an autocorrelation structure of the latent factors. Parameters of the model are estimated via EM algorithm employing Kalman filtering and smoothing and necessary restrictions are placed on the model, so the model becomes identifiable. After describing the theoretical concept of the approach, the dynamic factor model is applied to the real observed time series and the work discusses its behaviour and properties on one-month meteorological data of fire weather index at 108 fire stations located in British Columbia. The procedure of the model estimates a loadings matrix of the model with a corresponding small number of latent factors and a variance-covariance matrix of the modeled time series. The thesis applies k-means clustering to the resulted loadings matrix and provides a division of the stations into clusters based on the reduced dimensionality of the original data. With the estimated cluster means and the latent factors, it is possible to obtain particular mean trends for each cluster. Then, the achieved clusters are compared with the results obtained for the same set of stations but within a different month to assess the stability of the clustering. The work discusses the effect of varimax rotation on the loadings matrix as well. Moreover, the thesis suggests a method for detecting possible time series outliers based on the estimated variance-covariance matrix of the model and discusses the effect of outliers on the estimated model.
Keywords:
detekcia odľahlých časových rád; dynamický faktorový model; Fire Weather Index; k-means; zhlukovanie časových rád; dynamic factor model; Fire Weather Index; k-means; time series clustering; time series outlier detection
Institution: Brno University of Technology
(web)
Document availability information: Fulltext is available in the Brno University of Technology Digital Library. Original record: http://hdl.handle.net/11012/200093