haku: @keyword korrelaatio / yhteensä: 20
viite: 4 / 20
Tekijä: | Uurtio, Viivi |
Työn nimi: | Computational Analysis of Deep Bedrock Bacterial Communities |
Syvän peruskallion bakteeriyhteisöjen karakterisointia laskennallisin menetelmin | |
Julkaisutyyppi: | Diplomityö |
Julkaisuvuosi: | 2014 |
Sivut: | vii + 70 s. + liitt. 42 Kieli: eng |
Koulu/Laitos/Osasto: | Sähkötekniikan korkeakoulu |
Oppiaine: | Laskennallinen ja kognitiivinen biotiede (IL3003) |
Valvoja: | Rousu, Juho |
Ohjaaja: | Bomberg, Malin |
Elektroninen julkaisu: | http://urn.fi/URN:NBN:fi:aalto-201404181702 |
OEVS: | Sähköinen arkistokappale on luettavissa Aalto Thesis Databasen kautta.
Ohje Digitaalisten opinnäytteiden lukeminen Aalto-yliopiston Harald Herlin -oppimiskeskuksen suljetussa verkossaOppimiskeskuksen suljetussa verkossa voi lukea sellaisia digitaalisia ja digitoituja opinnäytteitä, joille ei ole saatu julkaisulupaa avoimessa verkossa. Oppimiskeskuksen yhteystiedot ja aukioloajat: https://learningcentre.aalto.fi/fi/harald-herlin-oppimiskeskus/ Opinnäytteitä voi lukea Oppimiskeskuksen asiakaskoneilla, joita löytyy kaikista kerroksista.
Kirjautuminen asiakaskoneille
Opinnäytteen avaaminen
Opinnäytteen lukeminen
Opinnäytteen tulostus
|
Sijainti: | P1 Ark Aalto 1010 | Arkisto |
Avainsanat: | metagenome deep bedrock aquifer multivariate data analysis kernel methods optimization correlation dimensionality reduction feature extraction metagenomi syvän peruskallion pohjavesikerros monimuuttuja-analyysi ydinfunktio-menetelmät optimointi korrelaatio dimension redusointi hahmontunnistus |
Tiivistelmä (fin): | Metagenomiikan tieteenalalla tutkitaan, miten tietyn ympäristön parametrit liittyvät siinä eläviin mikrobiyhteisöihin. Laskennallisesti tavoitteena on käsitellä metagenomista dataa siten, että siitä louhitut osajoukot korreloivat mikrobiyhteisöjen elinympäristöstä saatujen mittauksien kanssa. Tässä työssä louhittiin kahden eri metagenomisen, syvän peruskallion pohjavesikerroksista saadun, datajoukon korrelaatiorakennetta vertailemalla pääkomponenttianalyysiä (PCA) ydinfunktio-menetelmällä laajennetun (KCCA) ja asymmetrisen harvan kanonisen korrelaatioanalyysin (SCCA) kanssa. Menetelmiä vertailtiin korrelaatio- ja pistearvokuvaajilla, joita ei ole aikaisemmin sovellettu KCCA- tai SCCA-analyyseihin. Lisäksi SCCA-analyysin projektioiden kanonista korrelaatiota maksimoitiin parametrien optimoinnilla. Monimuuttujamenetelmien tuloksia vertailtiin Pearsonin lineaaristen korrelaatiokerrointen kanssa. Tässä työssä keskityttiin siihen, miten sulfaattia pelkistävät bakteeriyhteisöt vuorovaikuttavat elinympäristöstä saatujen geokemiallisten mittauksien kanssa. Sulfaatin pelkistäjät korreloivat odotetusti sulfaatin ja rikin kokonaismäärän kanssa. Tämän lisäksi sulfaatin pelkistäjät korreloivat pohjaveden suolaisuuden kanssa. Laskennallisesta näkökulmasta katsottuna SCCA oli menetelmistä stabiilein ja käyvin. Eri projektiosuuntien kanonisten korrelaatioiden vaihtelu korostui SCCA-analyysin parametrien optimoinnissa. Tässä työssä esitettyä tapaa visualisoida monimuuttujamenetelmien tuloksia voidaan hyödyntää myös muihinkin projektioihin perustuviin menetelmiin. |
Tiivistelmä (eng): | In the field of metagenomics, the aim is to relate characteristic environmental parameters to the microbial communities inhabiting the study site. In a computational framework, the objective is to extract subsets of features in metagenomic data that correlate with measurements obtained from the living environment of the microbial communities. We compared projection-based multivariate methods, principal component analysis (PCA), kernel canonical correlation analysis (KCCA) and asymmetrical sparse canonical correlation analysis (SCCA), by means of correlation and score plots, in order to assess the capability of each method to reveal the underlying correlation structure of two different metagenomic data sets originating from deep bedrock drill holes. This approach is novel in the sense that correlation and score plots have not yet been applied to the visualization of KCCA and SCCA results. We also integrated parameter optimization in SCCA in order to further maximize the correlation of the projections. As a basis of comparison, we computed Pearson's correlation coefficient among the two sets of features. From a microbiological perspective, we concentrated on the interactions of sulfate reducing bacteria with the geochemical measurements. In addition to the expected positive correlations with sulfate and total amount of sulfur, we discovered positive correlations among salinity and sulfate reducers. From a computational perspective, we demonstrated the feasibility and stability of SCCA in the extraction of highly correlating features from two co-dependent data sets in comparison to Pearson's correlation coefficient, PCA and KCCA. The results of the parameter optimization in SCCA emphasized the importance of selection of projection directions in terms of correlation. The presented framework of visualizing and selecting the projection directions can also be extended to other multivariate projection-based methods. |
ED: | 2014-04-20 |
INSSI tietueen numero: 48899
+ lisää koriin
INSSI