search query: @keyword stress / total: 19
reference: 10 / 19
« previous | next »
Author:Rinnet, Tapio
Title:Extracting Stress-related Effects from Yeast Gene Expression by Canonical Correlation Analysis
Stressiin liittyvien piirteiden irrottaminen hiivan geeniekspressiodatasta kanonisella korrelaatioanalyysilla
Publication type:Master's thesis
Publication year:2006
Pages:vi + 52      Language:   eng
Department/School:Teknillisen fysiikan ja matematiikan osasto
Main subject:Informaatiotekniikka   (T-61)
Supervisor:Kaski, Samuel
Instructor:Nikkilä, Janne
OEVS:
Electronic archive copy is available via Aalto Thesis Database.
Instructions

Reading digital theses in the closed network of the Aalto University Harald Herlin Learning Centre

In the closed network of Learning Centre you can read digital and digitized theses not available in the open network.

The Learning Centre contact details and opening hours: https://learningcentre.aalto.fi/en/harald-herlin-learning-centre/

You can read theses on the Learning Centre customer computers, which are available on all floors.

Logging on to the customer computers

  • Aalto University staff members log on to the customer computer using the Aalto username and password.
  • Other customers log on using a shared username and password.

Opening a thesis

  • On the desktop of the customer computers, you will find an icon titled:

    Aalto Thesis Database

  • Click on the icon to search for and open the thesis you are looking for from Aaltodoc database. You can find the thesis file by clicking the link on the OEV or OEVS field.

Reading the thesis

  • You can either print the thesis or read it on the customer computer screen.
  • You cannot save the thesis file on a flash drive or email it.
  • You cannot copy text or images from the file.
  • You cannot edit the file.

Printing the thesis

  • You can print the thesis for your personal study or research use.
  • Aalto University students and staff members may print black-and-white prints on the PrintingPoint devices when using the computer with personal Aalto username and password. Color printing is possible using the printer u90203-psc3, which is located near the customer service. Color printing is subject to a charge to Aalto University students and staff members.
  • Other customers can use the printer u90203-psc3. All printing is subject to a charge to non-University members.
Location:P1 Ark TF80     | Archive
Keywords:saccharomyces cerevisiae
canonical correlation analysis
stress
knockout
saccharomyces cerevisiae
kanoninen korrelaatioanalyysi
stressi
poistogeenimittaukset
Abstract (eng): Baker's yeast (Saccharomyces cerevisiae) is a widely used model organism in the study of eukaryotic species.
It is believed that yeast has a special set of genes that is always activated under any environmental stress.
This stress machinery might also become activated under other treatments which are not a priori known to be stressful.

Measurements where a gene is knocked out and resulting gene expression changes are measured, are widely applied in biology, and the resulting expression changes are usually attributed to be due to specific changes that result from removal of that gene from gene regulatory networks.
It might be that some of the expression changes are due to general stress response, and not taking this into account distorts the real expression changes that are due only to the knocked-out gene.

The key question in this thesis was biologically motivated: Are knockout expression measurements distorted due to stress?
The goal was to find a preliminary answer to this question.

From a data analysis point of view, we had 3 public large and high-dimensional data sets: Gene knockouts, stress, and cell cycle, which were brought in to represent normal variation in gene expression.

The analysis was about finding common properties from data sets.
Stress is hard to define rigorously, but it is the variation that is common to all stressful treatments.
If knockout experiments trigger a stress reaction, it is common to several knockouts.
There is also some normal variation in gene expression, some due to measurement technology and some due to the fact that the cell lives, and is thus the common variation present in measurements done in normal state.

The analysis proceeded by doing dimensionality reduction to all 3 data sets in a way that preserved the common variation.
This was done by Generalized Canonical Correlation Analysis.
Only those components were retained, which had statistically significant common variation.

Then the method Partial Canonical Correlation Analysis was used to find what was in common with the dimensionality reduced knockout and stress data sets that could not be explained by the (dimensionality reduced) cell cycle data set.
This common variation was stress.

35 out of 300 knockouts were found to be significantly associated with stress.
Method also produced a representation for the knockout data from which stress had been removed.

The method that was used works, does not require any parameter selection by hand, and is not constrained to just this one case.
It can be used in any situation, where a researcher wants to find common properties of two data sets that are not explainable by the common properties of a third data set.

This thesis was written at the Department of Computer Science at the University of Helsinki.
Abstract (fin): Hiiva (Saccharomyces cerevisiae) on laajalti käytetty malliorganismi eukarioottisten lajien tutkimuksessa.
Uskotaan, että hiivalla tietty joukko geenejä aktivoituu aina kaikissa stressaavissa ympäristöissä.
Tämä stressikoneisto saattaa käynnistyä myös olosuhteissa, joiden ei ennalta tiedetä olevan stressaavia.

Mittauksia, joissa geeni poistetaan ja tästä johtuvat muutokset geeniekspressiossa mitataan, käytetään laajalti biologiassa.
Havaittujen geeniekspressiomuutosten ajatellaan yleensä johtuvan geenin poistosta johtuvista muutoksista geenien säätelyverkostossa.
Voi olla, että osa havaituista ekspressionmuutoksista johtuu yleisestä stressireaktiosta, ja tämän huomiotta jättäminen vääristää kuvaa niistä todellisista ekspressionmuutoksista, jotka aiheutuvat nimenomaan tietyn geenin poistosta.

Avainkysymys tässä diplomityössä oli biologisesti motivoitu: Ovatko poistogeeniset ekspressionmuutokset vääristyneitä stressireaktiosta johtuen?
Päämäärä oli löytää tämän kysymykseen alustava vastaus.
Data-analyysin kannalta käytettävissä oli 3 suurta ja korkeadimensioista julkista datajoukkoa: Poistogeenimittaukset, stressimittaukset, ja solusyklimittaukset, jotka otettiin mukaan edustamaan normaalia variaatiota geeniekspressiossa.

Analyysissa haettiin yhteisiä piirteitä datajoukoista.
Stressiä on hankalaa määritellä täsmällisesti, mutta siihen liittyviä ekspressionmuutoksia esiintyy kaikissa stressaavissa olosuhteissa.
Jos poistogeeninen mittaus käynnistää stressireaktion, se on yhteistä useille poistogeenisille mittauksille.
Geeniekspressiossa on myös tiettyä normaalia vaihtelua, joka johtuu osittain mittausteknologiasta, ja osittain siitä että solu on elossa.
Tämä variaatio voidaan määritellä yhteisenä variaationa normaalitilassa tehdyissä mittauksissa.

Seuraavaksi kaikkien 3 datajoukon dimensionaalisuutta vähennettiin siten, että yhteiset piirteet datajoukoissa säilyivät.
Tämä tehtiin yleistetyllä kanonisella korrelaatioanalyysilla.
Vain ne löydetyt komponentit säilytettiin, jotka löysivät tilastollisesti merkittävää yhteistä variaatiota.
Seuraavaksi käytettiin osittaista kanonista korrelaatioanalyysia hakemaan ne yhteiset piirteet dimensiovähennetyn poistogeeni- ja stressidatajoukkojen väliltä, joita ei voitu selittää (dimensiovähennetyllä) solusyklidatalla.
Tämä yhteinen variaatio oli stressiä. 300 poistogeenimittauksesta 35:llä oli merkitsevästi yhteistä stressin kanssa.
Menetelmä tuotti myös esityksen poistogeenidatalle, josta stressi oli poistettu.

Käytetty menetelmä toimii, ei vaadi parametrien valintaa kasin, eikä ole rajoitettu vain käsiteltyyn tapaukseen.
Sitä voidaan käyttää kaikissa tapauksissa, joissa tutkijan tarvitsee löytää yhteiset ominaisuudet kahdesta datajoukosta, joita ei voi selittää kolmannen datajoukon yhteisillä ominaisuuksilla.
Tämä diplomityö kirjoitettiin Helsingin Yliopiston Tietojenkäsittelytieteen laitoksella.
ED:2006-09-28
INSSI record number: 32427
+ add basket
« previous | next »
INSSI