haku: @instructor Nikkilä, Janne / yhteensä: 5
viite: 3 / 5
Tekijä:Rinnet, Tapio
Työn nimi:Extracting Stress-related Effects from Yeast Gene Expression by Canonical Correlation Analysis
Stressiin liittyvien piirteiden irrottaminen hiivan geeniekspressiodatasta kanonisella korrelaatioanalyysilla
Julkaisutyyppi:Diplomityö
Julkaisuvuosi:2006
Sivut:vi + 52      Kieli:   eng
Koulu/Laitos/Osasto:Teknillisen fysiikan ja matematiikan osasto
Oppiaine:Informaatiotekniikka   (T-61)
Valvoja:Kaski, Samuel
Ohjaaja:Nikkilä, Janne
OEVS:
Sähköinen arkistokappale on luettavissa Aalto Thesis Databasen kautta.
Ohje

Digitaalisten opinnäytteiden lukeminen Aalto-yliopiston Harald Herlin -oppimiskeskuksen suljetussa verkossa

Oppimiskeskuksen suljetussa verkossa voi lukea sellaisia digitaalisia ja digitoituja opinnäytteitä, joille ei ole saatu julkaisulupaa avoimessa verkossa.

Oppimiskeskuksen yhteystiedot ja aukioloajat: https://learningcentre.aalto.fi/fi/harald-herlin-oppimiskeskus/

Opinnäytteitä voi lukea Oppimiskeskuksen asiakaskoneilla, joita löytyy kaikista kerroksista.

Kirjautuminen asiakaskoneille

  • Aalto-yliopistolaiset kirjautuvat asiakaskoneille Aalto-tunnuksella ja salasanalla.
  • Muut asiakkaat kirjautuvat asiakaskoneille yhteistunnuksilla.

Opinnäytteen avaaminen

  • Asiakaskoneiden työpöydältä löytyy kuvake:

    Aalto Thesis Database

  • Kuvaketta klikkaamalla pääset hakemaan ja avaamaan etsimäsi opinnäytteen Aaltodoc-tietokannasta. Opinnäytetiedosto löytyy klikkaamalla viitetietojen OEV- tai OEVS-kentän linkkiä.

Opinnäytteen lukeminen

  • Opinnäytettä voi lukea asiakaskoneen ruudulta tai sen voi tulostaa paperille.
  • Opinnäytetiedostoa ei voi tallentaa muistitikulle tai lähettää sähköpostilla.
  • Opinnäytetiedoston sisältöä ei voi kopioida.
  • Opinnäytetiedostoa ei voi muokata.

Opinnäytteen tulostus

  • Opinnäytteen voi tulostaa itselleen henkilökohtaiseen opiskelu- ja tutkimuskäyttöön.
  • Aalto-yliopiston opiskelijat ja henkilökunta voivat tulostaa mustavalkotulosteita Oppimiskeskuksen SecurePrint-laitteille, kun tietokoneelle kirjaudutaan omilla Aalto-tunnuksilla. Väritulostus on mahdollista asiakaspalvelupisteen tulostimelle u90203-psc3. Väritulostaminen on maksullista Aalto-yliopiston opiskelijoille ja henkilökunnalle.
  • Ulkopuoliset asiakkaat voivat tulostaa mustavalko- ja väritulosteita Oppimiskeskuksen asiakaspalvelupisteen tulostimelle u90203-psc3. Tulostaminen on maksullista.
Sijainti:P1 Ark TF80     | Arkisto
Avainsanat:saccharomyces cerevisiae
canonical correlation analysis
stress
knockout
saccharomyces cerevisiae
kanoninen korrelaatioanalyysi
stressi
poistogeenimittaukset
Tiivistelmä (fin): Hiiva (Saccharomyces cerevisiae) on laajalti käytetty malliorganismi eukarioottisten lajien tutkimuksessa.
Uskotaan, että hiivalla tietty joukko geenejä aktivoituu aina kaikissa stressaavissa ympäristöissä.
Tämä stressikoneisto saattaa käynnistyä myös olosuhteissa, joiden ei ennalta tiedetä olevan stressaavia.

Mittauksia, joissa geeni poistetaan ja tästä johtuvat muutokset geeniekspressiossa mitataan, käytetään laajalti biologiassa.
Havaittujen geeniekspressiomuutosten ajatellaan yleensä johtuvan geenin poistosta johtuvista muutoksista geenien säätelyverkostossa.
Voi olla, että osa havaituista ekspressionmuutoksista johtuu yleisestä stressireaktiosta, ja tämän huomiotta jättäminen vääristää kuvaa niistä todellisista ekspressionmuutoksista, jotka aiheutuvat nimenomaan tietyn geenin poistosta.

Avainkysymys tässä diplomityössä oli biologisesti motivoitu: Ovatko poistogeeniset ekspressionmuutokset vääristyneitä stressireaktiosta johtuen?
Päämäärä oli löytää tämän kysymykseen alustava vastaus.
Data-analyysin kannalta käytettävissä oli 3 suurta ja korkeadimensioista julkista datajoukkoa: Poistogeenimittaukset, stressimittaukset, ja solusyklimittaukset, jotka otettiin mukaan edustamaan normaalia variaatiota geeniekspressiossa.

Analyysissa haettiin yhteisiä piirteitä datajoukoista.
Stressiä on hankalaa määritellä täsmällisesti, mutta siihen liittyviä ekspressionmuutoksia esiintyy kaikissa stressaavissa olosuhteissa.
Jos poistogeeninen mittaus käynnistää stressireaktion, se on yhteistä useille poistogeenisille mittauksille.
Geeniekspressiossa on myös tiettyä normaalia vaihtelua, joka johtuu osittain mittausteknologiasta, ja osittain siitä että solu on elossa.
Tämä variaatio voidaan määritellä yhteisenä variaationa normaalitilassa tehdyissä mittauksissa.

Seuraavaksi kaikkien 3 datajoukon dimensionaalisuutta vähennettiin siten, että yhteiset piirteet datajoukoissa säilyivät.
Tämä tehtiin yleistetyllä kanonisella korrelaatioanalyysilla.
Vain ne löydetyt komponentit säilytettiin, jotka löysivät tilastollisesti merkittävää yhteistä variaatiota.
Seuraavaksi käytettiin osittaista kanonista korrelaatioanalyysia hakemaan ne yhteiset piirteet dimensiovähennetyn poistogeeni- ja stressidatajoukkojen väliltä, joita ei voitu selittää (dimensiovähennetyllä) solusyklidatalla.
Tämä yhteinen variaatio oli stressiä. 300 poistogeenimittauksesta 35:llä oli merkitsevästi yhteistä stressin kanssa.
Menetelmä tuotti myös esityksen poistogeenidatalle, josta stressi oli poistettu.

Käytetty menetelmä toimii, ei vaadi parametrien valintaa kasin, eikä ole rajoitettu vain käsiteltyyn tapaukseen.
Sitä voidaan käyttää kaikissa tapauksissa, joissa tutkijan tarvitsee löytää yhteiset ominaisuudet kahdesta datajoukosta, joita ei voi selittää kolmannen datajoukon yhteisillä ominaisuuksilla.
Tämä diplomityö kirjoitettiin Helsingin Yliopiston Tietojenkäsittelytieteen laitoksella.
Tiivistelmä (eng): Baker's yeast (Saccharomyces cerevisiae) is a widely used model organism in the study of eukaryotic species.
It is believed that yeast has a special set of genes that is always activated under any environmental stress.
This stress machinery might also become activated under other treatments which are not a priori known to be stressful.

Measurements where a gene is knocked out and resulting gene expression changes are measured, are widely applied in biology, and the resulting expression changes are usually attributed to be due to specific changes that result from removal of that gene from gene regulatory networks.
It might be that some of the expression changes are due to general stress response, and not taking this into account distorts the real expression changes that are due only to the knocked-out gene.

The key question in this thesis was biologically motivated: Are knockout expression measurements distorted due to stress?
The goal was to find a preliminary answer to this question.

From a data analysis point of view, we had 3 public large and high-dimensional data sets: Gene knockouts, stress, and cell cycle, which were brought in to represent normal variation in gene expression.

The analysis was about finding common properties from data sets.
Stress is hard to define rigorously, but it is the variation that is common to all stressful treatments.
If knockout experiments trigger a stress reaction, it is common to several knockouts.
There is also some normal variation in gene expression, some due to measurement technology and some due to the fact that the cell lives, and is thus the common variation present in measurements done in normal state.

The analysis proceeded by doing dimensionality reduction to all 3 data sets in a way that preserved the common variation.
This was done by Generalized Canonical Correlation Analysis.
Only those components were retained, which had statistically significant common variation.

Then the method Partial Canonical Correlation Analysis was used to find what was in common with the dimensionality reduced knockout and stress data sets that could not be explained by the (dimensionality reduced) cell cycle data set.
This common variation was stress.

35 out of 300 knockouts were found to be significantly associated with stress.
Method also produced a representation for the knockout data from which stress had been removed.

The method that was used works, does not require any parameter selection by hand, and is not constrained to just this one case.
It can be used in any situation, where a researcher wants to find common properties of two data sets that are not explainable by the common properties of a third data set.

This thesis was written at the Department of Computer Science at the University of Helsinki.
ED:2006-09-28
INSSI tietueen numero: 32427
+ lisää koriin
INSSI