Dynamická faktorová analýza časových řad

Loading...
Thumbnail Image
Date
ORCID
Mark
A
Journal Title
Journal ISSN
Volume Title
Publisher
Vysoké učení technické v Brně. Fakulta strojního inženýrství
Abstract
Táto diplomová práca sa zaoberá novým prístupom k zhlukovaniu časových rád na základe dynamického faktorového modelu. Dynamický faktorový model je technika redukujúca dimenziu a rozširuje klasickú faktorovú analýzu o požiadavku autokorelačnej štruktúry latentných faktorov. Parametre modelu sa odhadujú pomocou EM algoritmu za použitia Kalmanovho filtra a vyhladzovača a taktiež sú aplikované nevyhnutné podmienky na model, aby sa stal identifikovateľným. Po tom, ako je v práci predstavený teoretický koncept prístupu, dynamický faktorový model je aplikovaný na skutočné pozorované časové rady a práca skúma jeho správanie a vlastnosti na jednomesačných meteorologických dátach požiarneho indexu (Fire Weather Index) na 108 požiarnych staniciach umiestnených v Britskej Kolumbii. Postup výpočtu modelu odhadne záťažovú maticu (loadings matrix) spolu so zodpovedajúcim malým počtom latentných faktorov a kovariačnou maticou modelovaných časových rád. Diplomová práca aplikuje k-means zhlukovanie na výslednú záťažovú maticu a ponúka rozdelenie meteorologických staníc do zhlukov založené na redukovanej dimenzionalite pôvodných dát. Vďaka odhadnutým priemerom zhlukov a odhadnutým latentným faktorom je možné získať aj priemerné trendy každého zhluku. Následne sú dosiahnuté výsledky porovnané s výsledkami získanými na dátach z rovnakých staníc avšak iného mesiaca, aby sa stanovila stabilita zhlukovania. Práca sa taktiež zaoberá efektom varimax rotácie záťažovej matice. Diplomová práca naviac navrhuje metódu detekovania odľahlých časových rád založenú na odhadnutej kovariačnej matici modelu a rozoberá dôsledky odľahlých hodnôt na odhanutý model.
This thesis studies a novel approach to time series clustering based on a dynamic factor model. Dynamic factor model is a dimension reduction technique enhancing classical factor analysis by a requirement of an autocorrelation structure of the latent factors. Parameters of the model are estimated via EM algorithm employing Kalman filtering and smoothing and necessary restrictions are placed on the model, so the model becomes identifiable. After describing the theoretical concept of the approach, the dynamic factor model is applied to the real observed time series and the work discusses its behaviour and properties on one-month meteorological data of fire weather index at 108 fire stations located in British Columbia. The procedure of the model estimates a loadings matrix of the model with a corresponding small number of latent factors and a variance-covariance matrix of the modeled time series. The thesis applies k-means clustering to the resulted loadings matrix and provides a division of the stations into clusters based on the reduced dimensionality of the original data. With the estimated cluster means and the latent factors, it is possible to obtain particular mean trends for each cluster. Then, the achieved clusters are compared with the results obtained for the same set of stations but within a different month to assess the stability of the clustering. The work discusses the effect of varimax rotation on the loadings matrix as well. Moreover, the thesis suggests a method for detecting possible time series outliers based on the estimated variance-covariance matrix of the model and discusses the effect of outliers on the estimated model.
Description
Citation
SLÁVIK, Ľ. Dynamická faktorová analýza časových řad [online]. Brno: Vysoké učení technické v Brně. Fakulta strojního inženýrství. 2021.
Document type
Document version
Date of access to the full text
Language of document
en
Study field
Matematické inženýrství
Comittee
prof. RNDr. Zdeněk Pospíšil, Dr. (předseda) prof. Aleksandre Lomtatidze, DrSc. (místopředseda) doc. RNDr. Zdeněk Karpíšek, CSc. (člen) doc. PaedDr. Dalibor Martišek, Ph.D. (člen) doc. Mgr. Petr Vašík, Ph.D. (člen)
Date of acceptance
2021-06-24
Defence
Student předstvil prezentaci svoji diplomové práce týkající se dynamického faktorového modelu pro modelování rizika požárů. Vycházel z reálných dat z Kanady z požárů v roce 2003. Práce studenta byla oceněna v roce 2021 3. místem SVOČ. V následné diskuzi student zodpověděl otázky oponenta. V následné diskuzi položil dotaz doc. Karpíšek týkající se citlivost vzhledem k nenormalitě dat. Diplomant netestoval na nenormalitě, normalita byla dostatečná. Test pro outliery byl použit neparametrický, kde nenormalita není důležitá. Další otázka se týkala počtu shluků pro k-means (student srozumitelně vysvětlil) a zda by bylo možné zredukovat počet stanic nutných k pozorování. Diplomant uvedl, že není úkolem práce určit tento závěr, ale pracovat s množstvím dat z těchto stanic.
Result of defence
práce byla úspěšně obhájena
Document licence
Standardní licenční smlouva - přístup k plnému textu bez omezení
DOI
Collections
Citace PRO