Author: | Luttinen, Jaakko |
Title: | Gaussian-process factor analysis for modeling spatio-temporal data |
Gaussisiin prosesseihin perustuva faktorianalyysimalli avaruusajalliselle datalle | |
Publication type: | Master's thesis |
Publication year: | 2009 |
Pages: | 73 Language: eng |
Department/School: | Informaatio- ja luonnontieteiden tiedekunta |
Main subject: | Informaatiotekniikka (T-61) |
Supervisor: | Oja, Erkki |
Instructor: | Ilin, Alexander |
OEVS: | Electronic archive copy is available via Aalto Thesis Database.
Instructions Reading digital theses in the closed network of the Aalto University Harald Herlin Learning CentreIn the closed network of Learning Centre you can read digital and digitized theses not available in the open network. The Learning Centre contact details and opening hours: https://learningcentre.aalto.fi/en/harald-herlin-learning-centre/ You can read theses on the Learning Centre customer computers, which are available on all floors.
Logging on to the customer computers
Opening a thesis
Reading the thesis
Printing the thesis
|
Location: | P1 Ark T80 | Archive |
Keywords: | factor analysis Gaussian processes variational Bayesian inference faktorianalyysi gaussiset prosessit variotionaalinen bayesilainen päättely |
Abstract (eng): | The main theme of this thesis is analyzing and modeling large spatio-temporal datasets, such as global temperature measurements. The task is typically to extract relevant structure and features for predicting or studying the system. This can be a challenging problem because simple models are often not able to capture the complex structure suffiently well, and more sophisticated models can be computationally too expensive in practice. This thesis presents a novel spatio-temporal model which extends factor analysis by setting Gaussian process priors over the spatial and temporal components. In contrast to factor analysis, the presented model is capable of modeling complex spatial and temporal structure. Compared to standard Gaussian process regression over the spatio-temporal domain, the presented model gains substantial computational savings by operating only in the spatial or temporal domain at a time. Thus, it is feasible to model larger spatio-temporal datasets than with standard Gaussian process regression. The new model combines the modeling assumptions of several traditional techniques used for analyzing spatially and temporally distributed data: kriging is used for modeling spatial dependencies; empirical orthogonal functions reduce the dimensionality of the problem; and temporal smoothing finds relevant features from time series. The model is applied to reconstruct missing values in a historical sea surface temperature dataset. The results are promising and suggest that the proposed model may outperform the state-of-the-art reconstruction systems. |
Abstract (fin): | Tämän työn aiheena on suurien avaruusajallisten datakokoelmien, kuten maailmanlaajuisten lämpötilamittausten, analyysi ja mallinnus. Tehtävänä on yleensä löytää keskeisiä rakenteita ja piirteitä, joita voitaisiin hyödyntää systeemin käyttäytymisen ennustamiseen tai tutkimiseen. Tämä voi kuitenkin olla haastavaa, sillä yksinkertaiset mallit eivät kykene löytämään monimutkaisia rakenteita riittävän hyvin ja monimutkaisemmat mallit voivat olla laskennallisesti liian raskaita. Työssä esitellään uusi avaruusajallinen malli, joka laajentaa faktorianalyysia asettamalla paikka- ja aikakomponenttien priorit gaussisilla prosesseilla. Toisin kuin faktorianalyysi, esitelty malli kykenee mallintamaan monimutkaisia paikka- ja aikarakenteita. Normaaliin gaussisten prosessien regressioon verrattuna malli saavuttaa merkittäviä säästöjä laskenta-ajoissa toimimalla kerrallaan vain joko paikan tai ajan suhteen. Täten menetelmä kykenee mallintamaan suurempia avaruusajallisia datakokoelmia kuin normaaleilla gaussisilla prosesseilla on yleensä mahdollista. Uusi malli yhdistää oletuksia useista perinteisistä menetelmistä, joita käytetään paikan ja ajan suhteen jakautuneelle datalle: kriging-menetelmä mallintaa riippuvuuksia paikkojen välillä, empiiristen ortogonaalisten funktioiden menetelmä pienentää dimensionaalisuutta, ja ajallinen siloitus löytää aikasarjoista oleellisia piirteitä. Mallia käytetään rekonstruoimaan puuttuvia arvoja historiallisessa meren lämpötilan datakokoelmassa. Tulokset ovat lupaavia ja antavat toiveita, että esitelty malli voi rekonstruoida paremmin kuin nykytason rekonstruointimenetelmät. |
ED: | 2010-01-20 |
INSSI record number: 38779
+ add basket
INSSI