haku: @keyword bayesilainen päättely / yhteensä: 17
viite: 5 / 17
Tekijä:Peura, Heikki Eemeli
Työn nimi:Gaussian Process Models for Genome-Wide Association Analysis
Gaussiset prosessit genominlaajuisessa assosiaatioanalyysissä
Julkaisutyyppi:Diplomityö
Julkaisuvuosi:2010
Sivut:[12] + 84      Kieli:   eng
Koulu/Laitos/Osasto:Informaatio- ja luonnontieteiden tiedekunta
Oppiaine:Laskennallinen tekniikka   (S-114)
Valvoja:Lampinen, Jouko
Ohjaaja:Vehtari, Aki
OEVS:
Sähköinen arkistokappale on luettavissa Aalto Thesis Databasen kautta.
Ohje

Digitaalisten opinnäytteiden lukeminen Aalto-yliopiston Harald Herlin -oppimiskeskuksen suljetussa verkossa

Oppimiskeskuksen suljetussa verkossa voi lukea sellaisia digitaalisia ja digitoituja opinnäytteitä, joille ei ole saatu julkaisulupaa avoimessa verkossa.

Oppimiskeskuksen yhteystiedot ja aukioloajat: https://learningcentre.aalto.fi/fi/harald-herlin-oppimiskeskus/

Opinnäytteitä voi lukea Oppimiskeskuksen asiakaskoneilla, joita löytyy kaikista kerroksista.

Kirjautuminen asiakaskoneille

  • Aalto-yliopistolaiset kirjautuvat asiakaskoneille Aalto-tunnuksella ja salasanalla.
  • Muut asiakkaat kirjautuvat asiakaskoneille yhteistunnuksilla.

Opinnäytteen avaaminen

  • Asiakaskoneiden työpöydältä löytyy kuvake:

    Aalto Thesis Database

  • Kuvaketta klikkaamalla pääset hakemaan ja avaamaan etsimäsi opinnäytteen Aaltodoc-tietokannasta. Opinnäytetiedosto löytyy klikkaamalla viitetietojen OEV- tai OEVS-kentän linkkiä.

Opinnäytteen lukeminen

  • Opinnäytettä voi lukea asiakaskoneen ruudulta tai sen voi tulostaa paperille.
  • Opinnäytetiedostoa ei voi tallentaa muistitikulle tai lähettää sähköpostilla.
  • Opinnäytetiedoston sisältöä ei voi kopioida.
  • Opinnäytetiedostoa ei voi muokata.

Opinnäytteen tulostus

  • Opinnäytteen voi tulostaa itselleen henkilökohtaiseen opiskelu- ja tutkimuskäyttöön.
  • Aalto-yliopiston opiskelijat ja henkilökunta voivat tulostaa mustavalkotulosteita Oppimiskeskuksen SecurePrint-laitteille, kun tietokoneelle kirjaudutaan omilla Aalto-tunnuksilla. Väritulostus on mahdollista asiakaspalvelupisteen tulostimelle u90203-psc3. Väritulostaminen on maksullista Aalto-yliopiston opiskelijoille ja henkilökunnalle.
  • Ulkopuoliset asiakkaat voivat tulostaa mustavalko- ja väritulosteita Oppimiskeskuksen asiakaspalvelupisteen tulostimelle u90203-psc3. Tulostaminen on maksullista.
Sijainti:P1 Ark Aalto  84   | Arkisto
Avainsanat:Gaussian processes
Bayesian inference
genetic epidemiology
metabolic syndrome
gaussiset prosessit
bayesilainen päättely
geneettinen epidemiologia
metabolinen oireyhtymä
Tiivistelmä (fin): Viime vuosina koko genomin kattavat aineistot ja niiden yhteyttä periytyviin ominaisuuksiin analysoivat genominlaajuiset assosiaatiotutkimukset (GWA) ovat mullistaneet geneettisen epidemiologian tutkimuksen.
Nämä suhteellisen yksinkertaisia tilastollisia malleja käyttävät tutkimukset ovat kuitenkin pystyneet selittämään vain murto-osan perinnölliseksi oletetusta variaatiosta.
Toisaalta aineistojen laajuus rajoittaa hienostuneempien mallien käyttöönottoa, kuten interaktioiden tapauksessa.

Tässä työssä käytetään gaussisia prosesseja (GP) bayesilaiseen tilastolliseen päättelyyn geneettisessä epidemiologiassa.
Epäparametrisen ja epälineaarisen luonteensa vuoksi gaussiset prosessit soveltuvat hyvin geneettisen variaation ominaisuuksien mallintamiseen.
Jotta GP-malleja voitaisiin soveltaa GWAaineistoon, on sen dimensionaalisuutta kuitenkin pudotettava, mikä tässä työssä tehdään laskemalla numeerinen arvo yksilöiden väliselle geneettiselle samankaltaisuudelle.
Tämä kuitenkin rajoittaa käytettävien GP-mallien ominaisuuksia jossain määrin.

Kehitettyjen mallien tilastollisen päättelyn kohteena on metabolinen oireyhtymä, erilaisten usein yhdessä esiintyvien metabolisten oireiden yhdistelmä, joka on nopeassa kasvussa ympäri maailmaa.
Metabolinen oireyhtymä kompleksisine, kiistanalaisine määritelmineen on aiemmassa tutkimuksessa osoittautunut poikkeuksellisen vaikeaksi tutkimuskohteeksi.
Tässä työssä GP-mallia sovelletaan oireyhtymän ja sen osatekijöiden tutkimukseen, ja Markovin ketju-Monte Carlo- -näytteistämiseen perustuvaa menetelmää käytetään merkittävien geneettisten alueiden etsintään.

Tutkittavilla GP-malleilla on mahdollista löytää saman suuruusluokan ilmiöitä kuin aiemmissa tutkimuksissa.
GP-pohjainen geneettisten alueiden etsintä näyttää olevan tuloksiltaan perinteisiä menetelmiä parempi, mutta sen vaatiman laskentatehon vuoksi se ei vielä sovellu genominlaajuisten aineistojen käsittelyyn.
Vaikka useille tutkituille piirteille saadaan lupaavia tuloksia, viittaavat metabolisen oireyhtymän vaatimattomat tulokset siihen, että tutkimusta kannattaisi jatkaa eri tekijät yhdessä sisältävällä monimuuttujamallilla.
Tiivistelmä (eng): In recent years, the field of genetic epidemiology has experienced a surge through the genotyping of genome-wide data sets and the genome wide association (GWA) studies designed to link the genetic data to complex phenotypes.
However, these studies employing relatively simple statistical methods have been able to explain but a fraction of the variation thought to be attributable to genes in various traits and disorders.
On the other hand, the high dimensionality of genetic data restricts the use of more sophisticated models, such as those involving interactions.

This thesis develops Gaussian process (GP) models for Bayesian statistical inference in genetic epidemiology.
Gaussian processes, due to their non-parametric and non-linear nature, seem fit to estimate the unknown characteristics of genetic variation.
However, to apply Gaussian process models to a GWA study data set, its high dimensionality has to be reduced, which in this work is done by using a score of genetic similarity between individuals.
This procedure slightly restricts the properties of the Gaussian process.

The developed models are used to make inferences on the genetic and environmental determinants of metabolic syndrome, a combination of several clustering metabolic disorders currently in a sharp increase around the world.
Metabolic syndrome, partly due to its controversial, complex definition, has proven to be an elusive target for genetic epidemiologists.
Here, GP models were used to make general inferences on the syndrome and its constituent factors, and a Markov chain Monte Carlo sampling scheme was used to search for genetic areas of importance.

The GP models were able to find effects of similar magnitude as existing studies.
While a GP-based search is likely to outperform simple statistical tests, the computational cost of the implemented models is currently too high to obtain conclusive evidence, and, consequently, to make the search viable in the GWA context.
While the work yielded promising results for several of the studied traits, metabolic syndrome itself was found a difficult subject of study, suggesting that, perhaps, more insight could be gained by studying the factors together in a multi-output model.
ED:2010-06-11
INSSI tietueen numero: 39797
+ lisää koriin
INSSI