search query: @supervisor Tarhio, Jorma / total: 69
reference: 3 / 69
« previous | next »
Author:Alanko, Jarno
Title:Space-efficient clustering of metagenomic read sets
Tilatehokas metagenomisten DNA-fragmenttien ryhmittely
Publication type:Master's thesis
Publication year:2015
Pages:66      Language:   eng
Department/School:Perustieteiden korkeakoulu
Main subject:Tietojenkäsittelytiede   (IL3010)
Supervisor:Tarhio, Jorma
Instructor:Cunial, Fabio ; Belazzougui, Djamal
Electronic version URL: http://urn.fi/URN:NBN:fi:aalto-201601201068
Location:P1 Ark Aalto  3448   | Archive
Keywords:Burrows-Wheeler transform
metagenomics
clustering
space-efficient
Burrows-Wheeler muunnos
metagenomiikka
ryhmittely
tilatehokas
Abstract (eng):The collection of all genomes in an environment is called the metagenome of the environment.
In the past 15 years, high-throughput sequencing has made it feasible to sequence entire environments at once for the first time in history, which has resulted in a variety of interesting new algorithmic problems.
This thesis focuses on the basic problem of clustering the reads from an environment according to which species, or more generally, taxonomic unit they originate from.

In this work, we identify and formalize two fundamental string processing tasks useful in clustering metagenomic read sets.
We solve the two problems with space efficiency in mind using the recently developed bidirectional Burrows-Wheeler index.
The algorithms were implemented in a way which makes parallel processing possible.
Our tool is experimentally shown to give good results for simple simulated datasets, and to use less than 10 times less space and time compared to two recently published metagenome clustering tools.
Abstract (fin):Kaikkien ympäristössä esiintyvien genomien joukkoa kutsutaan kyseisen ympäristön \emph{metagenomiksi}.
Viimeisen 15 vuoden aikana kehitetyt korkean läpisyötön sekvenssoriteknologiat ovat mahdollistaneet ensimmäistä kertaa historiassa kokonaisen ympäristön metagenomin kartoittamisen.
Tämä kehityssuunta on johtanut uusiin mielenkiintoisiin algoritmisiin ongelmiin.
Tämä työ käsittelee ympäristöistä näytteistettyjen DNA-fragmenttejen ryhmittelyä lajien, tai yleisemmin taksonomisten yksiköiden mukaan.

Työssä tunnistetaan ja formalisoidaan kaksi merkkijono-ongelmaa, jotka ilmentyvät metagenomisten DNA-fragmentteja ryhmittelyssä.
Ongelmiin esitetään tilatehokkaat ratkaisut käyttäen hiljattain kehitettyä kaksisuuntaista Burrows-Wheeler indeksiä.
Algoritmit toteutettiin pitäen silmällä rinnakkaista laskentaa.
Työssä osoitetaan, että uusi toteutus antaa hyviä tuloksia yksinkertaisille simuloiduille näytteille, ja että työkalu on kymmenen kertaa nopeampi ja tilatehokkaampi, kuin kaksi hiljattain julkaistua metagenomisten näytteiden ryhmittelyyn tarkoitettua työkalua.
ED:2016-02-21
INSSI record number: 53122
+ add basket
« previous | next »
INSSI