haku: @keyword latent variable model / yhteensä: 4
viite: 4 / 4
« edellinen | seuraava »
Tekijä:Aukia, Janne
Työn nimi:Bayesian clustering of huge friendship networks
Bayesilaisen klusteroinnin soveltaminen erittäin suuriin ystävyysverkkoihin
Julkaisutyyppi:Diplomityö
Julkaisuvuosi:2007
Sivut:88 + (viii)      Kieli:   eng
Koulu/Laitos/Osasto:Tietotekniikan osasto
Oppiaine:Informaatiotekniikka   (T-61)
Valvoja:Kaski, Samuel
Ohjaaja:Sinkkonen, Janne
Digitoitu julkaisu: https://aaltodoc.aalto.fi/handle/123456789/94964
OEVS:
Digitoitu arkistokappale on julkaistu Aaltodocissa
Sijainti:P1 Ark Aalto  5318   | Arkisto
Avainsanat:clustering
friendship network
Bayesian inference
latent variable model
klusterointi
ystävyysverkko
bayesilainen päättely
latenttimuuttujamalli
Tiivistelmä (fin):Sosiaalisten verkkopalveluiden, joita ovat esimerkiksi MySpace, Facebook ja Last.fm, viimeaikaisen suosion kasvun myötä kiinnostus erittäin suurten ystävyysverkostojen analysointiin on kasvanut.
Näissä verkoissa on jopa miljoonia solmuja, joten ne tarjoavat hyvän testiympäristön uusille verkkoalgoritmeille.
Verkkojen analysointimenetelmiä voidaan hyödyntää myös muihin kuin sosiaalisiin verkkoihin, kuten proteiinien välisiin vuorovaikutusverkkoihin ja verkkosivujen välisiin linkkeihin.

Sosiaalisilla verkostoilla on tyypillisesti rakenne: niissä on tiheitä solmuryhmittymiä, ja joillakin solmuilla on suhteettoman paljon yhteyksiä.
Rakenne syntyy, koska ystävyydet eivät muodostu satunnaisesti.
Ihmiset sen sijaan tapaavat ystävystyi samanlaisten ihmisten kanssa.
Tätä voi kutsua homofiliaksi.
Ystävyyksien syntyyn vaikuttavat myös muut tekijät kuten maantieteellinen sijainti ja yhteisiin aktiviteetteihin osallistuminen.

M0-algoritmi löytää klusterirakenteen homofiilisistä verkoista bayesilaisen tilastollisen inferenssin avulla.
Algoritmi pohjautuu generatiiviseen malliin, jossa verkon sivut luodaan latenttien komponenttien perusteella.
Mallin parametrien tilastollisessa päättelyssä käytetään Gibbs-otantaa.
Homofilian vuoksi samaan klusteriin kuuluvilla solmuilla on todennäköisesti yhteisiä piirteitä.

Tässä diplomityössä esitetään MO-algoritmille tehokas toteutus, joka käyttää tasapainotettua binääripuuta komponenttien todennäköisyyksien tallennukseen.
Toteutus toimii jopa miljoonien solmujen verkoilla.
Algoritmia testataan joukolla aiemmin tutkittuja pieniä verkkoja ja Last.fm-palvelusta kerätyllä ystävyysverkolla, jossa on yli 600 000 käyttäjää.

Algoritmi löytää merkityksellisiä rakenteita monenkokoisista verkoista, ja tulokset ovat vertailukelpoisia hierarkisilla klusterointimenetelmillä saatujen tulosten kanssa.
Menetelmän vahvuus on solmujen sumea klusterointi, jossa solmu voi kuulua samanaikaisesti useaan klusteriin.
Hyperparametrien valinta on kuitenkin usein hankalaa.
ED:2007-11-12
INSSI tietueen numero: 34828
+ lisää koriin
« edellinen | seuraava »
INSSI