haku: @keyword transfer learning / yhteensä: 2
viite: 1 / 2
« edellinen | seuraava »
Tekijä:Leppäaho, Eemeli
Työn nimi:Transfer Learning with Group Factor Analysis
Siirto-oppimista ryhmäfaktorianalyysilla
Julkaisutyyppi:Diplomityö
Julkaisuvuosi:2013
Sivut:viii + 53      Kieli:   eng
Koulu/Laitos/Osasto:Perustieteiden korkeakoulu
Oppiaine:Informaatiotekniikka   (T-61)
Valvoja:Kaski, Samuel
Ohjaaja:Klami, Arto
Elektroninen julkaisu: http://urn.fi/URN:NBN:fi:aalto-201502261946
OEVS:
Sähköinen arkistokappale on luettavissa Aalto Thesis Databasen kautta.
Ohje

Digitaalisten opinnäytteiden lukeminen Aalto-yliopiston Harald Herlin -oppimiskeskuksen suljetussa verkossa

Oppimiskeskuksen suljetussa verkossa voi lukea sellaisia digitaalisia ja digitoituja opinnäytteitä, joille ei ole saatu julkaisulupaa avoimessa verkossa.

Oppimiskeskuksen yhteystiedot ja aukioloajat: https://learningcentre.aalto.fi/fi/harald-herlin-oppimiskeskus/

Opinnäytteitä voi lukea Oppimiskeskuksen asiakaskoneilla, joita löytyy kaikista kerroksista.

Kirjautuminen asiakaskoneille

  • Aalto-yliopistolaiset kirjautuvat asiakaskoneille Aalto-tunnuksella ja salasanalla.
  • Muut asiakkaat kirjautuvat asiakaskoneille yhteistunnuksilla.

Opinnäytteen avaaminen

  • Asiakaskoneiden työpöydältä löytyy kuvake:

    Aalto Thesis Database

  • Kuvaketta klikkaamalla pääset hakemaan ja avaamaan etsimäsi opinnäytteen Aaltodoc-tietokannasta. Opinnäytetiedosto löytyy klikkaamalla viitetietojen OEV- tai OEVS-kentän linkkiä.

Opinnäytteen lukeminen

  • Opinnäytettä voi lukea asiakaskoneen ruudulta tai sen voi tulostaa paperille.
  • Opinnäytetiedostoa ei voi tallentaa muistitikulle tai lähettää sähköpostilla.
  • Opinnäytetiedoston sisältöä ei voi kopioida.
  • Opinnäytetiedostoa ei voi muokata.

Opinnäytteen tulostus

  • Opinnäytteen voi tulostaa itselleen henkilökohtaiseen opiskelu- ja tutkimuskäyttöön.
  • Aalto-yliopiston opiskelijat ja henkilökunta voivat tulostaa mustavalkotulosteita Oppimiskeskuksen SecurePrint-laitteille, kun tietokoneelle kirjaudutaan omilla Aalto-tunnuksilla. Väritulostus on mahdollista asiakaspalvelupisteen tulostimelle u90203-psc3. Väritulostaminen on maksullista Aalto-yliopiston opiskelijoille ja henkilökunnalle.
  • Ulkopuoliset asiakkaat voivat tulostaa mustavalko- ja väritulosteita Oppimiskeskuksen asiakaspalvelupisteen tulostimelle u90203-psc3. Tulostaminen on maksullista.
Sijainti:P1 Ark Aalto  57   | Arkisto
Avainsanat:Bayesian data analysis
factor models
transfer learning
variational inference
bayesiläinen data-analyysi
faktorimallit
siirto-oppiminen
variationaalinen Bayes-päättely
Tiivistelmä (fin): Modernien mittaustekniikoiden avulla saadaan nykyään entistä enemmän aineistoa tutkittavaksi lyhyemmässä ajassa ja halvemmalla.
Kun tutkimuksen kohteena ovat esimerkiksi solun geenien ilmentymisarvot tai ihmisaivojen toiminta, yksi näyte voi koostua kymmenistä tuhansista muuttujista.
Usein näytteitä on paljon vähemmän kuin muuttujia, jolloin yksinkertaiset menetelmät ylisovittuvat aineistoon.
Faktorimallit on suunniteltu mallintamaan tällaista korkeaulotteista dataa matalaulotteisemman faktoriavaruuden avulla.
Faktorianalyysi on näistä malleista yksinkertaisin: se rekonstruoi jokaisen aineiston muuttujan latenttien faktorien (komponenttien) painotettuna summana.

Tässä diplomityössä sovelletaan ja edelleen kehitetään ryhmäfaktorianalyysiä (GFA), joka on faktorianalyysin laajennus useille aineistojoukoille.
Korkeaulotteinen data voidaan usein jakaa ryhmiin (näkymiin), jotka GFA ottaa huomioon mallintamalla komponenttiaktiivisuudet ryhmille yksittäisten muuttujien sijaan.
Mallissa on myös mukana komponenttien relevanssin määrittävä osa.
Nämä seikat tekevät GFA:sta käytännöllisen faktorimallin.

Tässä työssä laajennetaan ryhmäfaktorianalyysiä mallintamaan aineiston eri näkymien suhteita eksplisiittisesti.
Tämä tehdään mallintamalla näkymien komponenttiaktiivisuudet kahdella vaihtoehtoisella tavalla: moniulotteisen normaalijakauman näytteinä sekä kahden matalan rangin matriisin tulona.
Molemmat laajennukset ratkaistaan variationaalisen Bayes-päättelyn avulla, ja niiden tarkkuus aineiston mallintamisessa vastaa GFA:n tarkkuutta.
Aineistossa, jossa on useita näkymiä, matalan rangin GFA on tarkin malli.

Pienen näytemäärän ongelmaan puututaan lisäksi kahdella siirto-oppimismenetelmällä.
Toisessa hyödynnetään taustadataa, jossa on kohdedatan kanssa jaettuja näytteitä tai muuttujia.
Toisessa lähestymistavassa on menetelmänä syvemmän tason siirto-oppiminen.
Työssä osoitetaan sekä keinotekoisella että oikealla aineistolla, että molemmat menetelmät parantavat lopullista mallia, kunhan sopivaa taustadataa on saatavilla.
Oikea aineisto koostuu solulinjoille mikrosiruilla tehdyistä lääkevastemittauksista.
Tiivistelmä (eng): Modern measuring techniques allow us to get more and more data in less time and cheaper price.
When analyzing data, one sample might be the gene expression of a cell or the activity of a human brain at a certain time, consisting of tens of thousands of features.
Often we have much fewer samples than features, and simple methods will overfit the data.
Factor models are designed to model this kind of high-dimensional data via a lower dimensional factor space.
Factor analysis is the simplest factor model: it reconstructs each feature in the data as a weighted sum of the hidden factors (components).

In this thesis I examine group factor analysis (GFA), which is an extension of factor analysis for multiple data sets.
High-dimensional data can often be naturally divided to different groups (views), which GFA uses as prior information by inferring the component activities for views instead of single features.
This property combined with an automatic system for the component activity determination results in a powerful factor model.

In this thesis, GFA is extended to explicitly model hidden relations between different data views.
This is done by generating their component activity matrix in two alternative ways: as samples of a multivariate normal distribution and as a product of two low-rank matrices.
Both the extensions are solved via variational Bayesian inference, and are shown to model data with accuracy comparable to GFA.
For data with many views low-rank GFA is the most accurate model.

Additionally the problem of small number of samples is dealt with two transfer learning setups: one being able to take advantage of background data with samples or features shared with target data, and the other introducing a novel transfer learning setup.
It is shown, using both artificial and real data, that both of these setups allow us to form a better model when suitable background data is available.
The real data consists of drug response profiles measured on cell lines using two different microarray platforms.
ED:2013-03-25
INSSI tietueen numero: 46003
+ lisää koriin
« edellinen | seuraava »
INSSI