haku: @keyword klusterointi / yhteensä: 41
viite: 5 / 41
Tekijä:Toppila, Iiro
Työn nimi:Identifying novel phenotype profiles of diabetic complications and their genetic components using machine learning approaches
Diabeettisten komplikaatioiden uusien fenotyyppiprofiilien etsintä, sekä ryhmien välisten geneettisten komponenttien tunnistus koneoppimismenetelmiä hyödyntäen
Julkaisutyyppi:Diplomityö
Julkaisuvuosi:2016
Sivut:89+8      Kieli:   eng
Koulu/Laitos/Osasto:Sähkötekniikan korkeakoulu
Oppiaine:Laskennallinen ja kognitiivinen biotiede   (IL3003)
Valvoja:Lähdesmäki, Harri
Ohjaaja:Sandholm, Niina
Elektroninen julkaisu: http://urn.fi/URN:NBN:fi:aalto-201606172479
Sijainti:P1 Ark Aalto  4283   | Arkisto
Avainsanat:complications of type 1 diabetes
FinnDiane
multi-layer self-organizing map (SOM)
clustering
heritability
genome-wide association study (GWAS)
tyypin 1 diabeteksen komplikaatiot
monitasoinen itseorganisoituva kartta
klusterointi
heritabiliteetti
perimänlaajuinen assosiaatiotutkimus
Tiivistelmä (fin):Tyypin 1 diabetikoille saattaa kehittyä useita hitaasti eteneviä lisäsairauksia, jotka ovat osittain perinnöllisiä sekä keskenään korreloivia.
Sekä geneettiset että biologiset mekanismit näiden taustalla ovat kuitenkin pääasiassa vielä tuntemattomia.
Tämän työn tarkoituksena oli hyödyntää koneoppimis- ja tiedonlouhintamenetelmiä, joiden avulla pystyttäisiin vangitsemaan samanaikaisesti useiden diabeettisten komplikaatioden etenevä luonne, sekä muodostamaan uusia fenotyyppiluokkia diabeettisten komplikaatioiden ja niiden genetiikan tutkimuksen avuksi.

Työssä opetettiin monitasoinen itseorganisoituva kartta (SOM) käyttäen FinnDiane tutimuksessa kliinisistä muuttujista sekä ympäristötekijöistä kerättyä potilasdataa.
Uusien fenotyyppiluokkien luomiseksi opetetun kartan prototyyppialkiot klusteroitiin kokoavalla hierarkkisella klusteroinnilla.
Luokkien välisiä geneettisiä eroja vertailtiin heritabiliteettiestimaateilla.
Lisäksi luokkajakoon assosioituvien geneettisten markkereiden vaikutusta tutkittiin perimänlaajuisessa assosiaatiotutkimuksessa (GWAS) niiden luokkien välillä, jotka saavuttivat merkitseviä estimaatteja heritabiliteeteille.

Muodostetut potilasluokat olivat biologisesti mielekkäitä ja muodostetun luokkajaon estimoitiin olevan jopa 42% geneettisesti määräytyvä.
Perimänlaajuisissa assosiaatiotutkimuksissa geneettinen variantti (rs202095311 NRIP1 geenin viimeisessä intronissa) assosioitui yhteen muodostetuista luokkajaoista genominlaajuisella merkitsevyystasolla (p<5×10-8).
Lisäksi analyyseissa havaittiin viitteellisillä p-arvoilla useita muita geneettisiä alueita, joilla sijaitsee aiemmin diabeettisiin komplikaatioihin tai niiden riskitekijöihin yhdistettyjä geenejä ja prosesseja.

Yleisesti, uusi lähestymistapa kompleksisten sairauksien genetiikan tutkimukseen suoriutui sille asetetuista haasteista tyypin 1 diabeteksen ja sen komplikaatioiden tutkimuksessa ja vastaava lähestymistapa voisi olla hyödynnettävissä myös muiden kompleksisten sairauksien tutkimuksessa.
Tiivistelmä (eng):Patients with Type 1 diabetes (T1D) may develop a wide variety of additional slowly progressing complications, which have been shown to be partly heritable and to correlate with each other.
However, the genetic and biological mechanisms behind them are still mostly unknown.
The goal of this work was to use machine learning and data mining approaches that could capture the progressive nature of multiple complications simultaneously, and create novel phenotype classes that could help to solve the pathogenesis and genetics of diabetic complications.

To achieve this, a dual-layer self-organizing map (SOM) was trained using clinical and environmental patient data from the FinnDiane study, and the trained SOM node prototypes were clustered to classes using agglomerative hierarchical clustering.
The genetic differences between the created classes were evaluated using heritability estimates, and the genetic markers associated with the class assignments showing significant heritability were analysed in genome-wide association study (GWAS).

The created class assignments were biologically plausible, and were estimated to be up to 42% genetically determined.
The GWAS analyses detected a genetic marker (rs202095311, located in the last intron of the gene NRIP1) genome-wide significantly (p<5×10-8) associated with one of the created class assignments.
In addition, GWAS detected multiple other genetic regions with suggestive p-values that contained mostly genes and processes previously linked to diabetic complications or their risk factors.

Overall, the new approach to study the genetics of complex diseases was found to perform well in case of T1D and its complications, and could be used to study also other complex traits and diseases.
ED:2016-07-17
INSSI tietueen numero: 53911
+ lisää koriin
INSSI