haku: @keyword linear regression / yhteensä: 12
viite: 2 / 12
Tekijä: | Casado Cuervo, Julia |
Työn nimi: | Integrating ENCODE data to model transcriptional regulation |
Julkaisutyyppi: | Diplomityö |
Julkaisuvuosi: | 2014 |
Sivut: | vii + 54 s. + liitt. 3 Kieli: eng |
Koulu/Laitos/Osasto: | Perustieteiden korkeakoulu |
Oppiaine: | Informaatiotekniikka (T-61) |
Valvoja: | Rousu, Juho |
Ohjaaja: | Hautaniemi, Sampsa ; Hollmén, Jaakko ; Ovaska, Kristian |
Elektroninen julkaisu: | http://urn.fi/URN:NBN:fi:aalto-201507013756 |
OEVS: | Sähköinen arkistokappale on luettavissa Aalto Thesis Databasen kautta.
Ohje Digitaalisten opinnäytteiden lukeminen Aalto-yliopiston Harald Herlin -oppimiskeskuksen suljetussa verkossaOppimiskeskuksen suljetussa verkossa voi lukea sellaisia digitaalisia ja digitoituja opinnäytteitä, joille ei ole saatu julkaisulupaa avoimessa verkossa. Oppimiskeskuksen yhteystiedot ja aukioloajat: https://learningcentre.aalto.fi/fi/harald-herlin-oppimiskeskus/ Opinnäytteitä voi lukea Oppimiskeskuksen asiakaskoneilla, joita löytyy kaikista kerroksista.
Kirjautuminen asiakaskoneille
Opinnäytteen avaaminen
Opinnäytteen lukeminen
Opinnäytteen tulostus
|
Sijainti: | P1 Ark Aalto 2390 | Arkisto |
Avainsanat: | gene regulation modeling linear regression ChIP-seq RNA-seq public biodatabases ENCODE project |
Tiivistelmä (eng): | Gene transcription is an essential step in protein expression and fundamental understanding cell function and malfunction. Although our understanding of its underlying mechanisms has increased considerably during the last decade, determining the specific regulatory elements targeting the expression of a given gene remains a challenge. The development of next generation sequencing technologies enabled international consortia like the ENCODE project to produce vast amounts of high-throughput data. The ENCODE project made publicly available sequencing data on dozens of different tissues, and several biological features, including more than a hundred transcription factors. Due to the significant size and detail of these data, manual inspection is impractical, requiring automatic methods to perform this task. Here we present a computational pipeline to apply machine learning techniques to the high-throughput data available at the ENCODE repositories. We measure gene regulatory features from ChIP-seq data, and infer gene expression levels from RNA-seq data. Then, we apply linear regression analyses to model every protein-coding gene, and explore the predictive power of gene regulatory features for gene expression levels. Ultimately, we show the potential of using existing data and its contribution to further understand gene regulatory features. Our genome-wide regression analysis indicates that gene expression is not related to a linear combination of regulatory elements, but may be better modelled with a quadratic function. Further data will be necessary to accurately define the role i that each regulatory feature plays on the initiation of gene transcription. |
ED: | 2014-12-10 |
INSSI tietueen numero: 50142
+ lisää koriin
INSSI