haku: @instructor Kinnunen, Teemu / yhteensä: 8
viite: 1 / 8
« edellinen | seuraava »
Tekijä:Kärkkäinen, Kimmo
Työn nimi:Predicting demographics and motives of website users
Verkkosivuston käyttäjien demografioiden ja motiivien ennustaminen
Julkaisutyyppi:Diplomityö
Julkaisuvuosi:2016
Sivut:66 s. + liitt. 8      Kieli:   eng
Koulu/Laitos/Osasto:Perustieteiden korkeakoulu
Oppiaine:Computer Science   (SCI3042)
Valvoja:Gionis, Aristides
Ohjaaja:Kinnunen, Teemu
Elektroninen julkaisu: http://urn.fi/URN:NBN:fi:aalto-201610124943
Sijainti:P1 Ark Aalto  4543   | Arkisto
Avainsanat:demographics
motive
website
machine learning
analytics
demografia
motiivi
verkkosivusto
koneoppiminen
analytiikka
Tiivistelmä (fin):Asiakkaiden ymmärtäminen on tärkeää.
Sisällöntuottajien kohdalla tämä tarkoittaa ymmärrystä siitä, mitkä ihmisryhmät katsovat erilaisia sisältöjä, ja vieläkin tärkeämmin tietoa siitä, mitä ryhmiä ei ole vielä tavoitettu.
Verkkosivun kävijöistä ei kuitenkaan ole usein saatavilla tarkempaa tietoa, koska ihmiset vierailevat sivustoilla ilman rekisteröitymistä.
Tämän vuoksi tieto käyttäjistä täytyy selvittää muilla tavoin.

Tämä diplomityö tutki kuinka tarkasti verkkosivun vierailijoiden demografiat (ikä ja sukupuoli) sekä motiivit voidaan ennustaa.
Ennusteet tehtiin yksittäisen verkkosivuston analytiikkadataan pohjautuen.
Kyseinen analytiikkadata sisälsi tiedon käyttäjien katsomasta sisällöstä, mihin aikoihin käyttäjät olivat aktiivisia ja mitä selainta sekä käyttöjärjestelmää he käyttivät.
Lisäksi tämä diplomityö tutki kuinka paljon käyttödataa ennusteiden tekeminen vaatii sekä mitkä piirteet ovat hyödyllisiä ennustamisessa.

Demografioiden ennustaminen osoittautui mahdolliseksi hyvällä tarkkuudella.
Sukupuolen ennustaminen oli helpointa, ja sen tarkkuus oli 77,8 %.
Iän ennustaminen neljää ikäryhmää käyttäen sai painotetun F1-arvon 0,513.
Motiivien ennustaminen oli hankalampaa, ja vain osa motiiveista pystyttiin ennustamaan tarkemmin kuin mitä suosituimman vastauksen valitseminen kaikille olisi antanut.

Ennustuksen tarkkuus riippui vahvasti käyttäjän katsoman sisällön määrästä.
Lisäksi analytiikkadatassa vain käyttäjien katsoma sisältö oli merkittävä tekijä, eikä muiden piirteiden lisääminen parantanut tarkkuutta merkittävästi, kun käyttäjä oli katsonut jotakin sisältöä.
Tiivistelmä (eng):Understanding customers is important.
In the case of content providers, this means knowing which groups of people are viewing different types of content, and even more importantly, which groups of people are not yet your active users.
However, information about website's visitors is not typically available, as people might visit websites without making an account.
Therefore, there is a need for finding out information about the users in other ways.

This thesis studied how accurately demographics (age and gender) and motives can be predicted for website visitors.
The predictions were made using the analytics data from a single website.
This data included what content the users had viewed, at which times of the day they were active, and what browser and operating system they were using.
In addition, this thesis studied how much data is needed to make the predictions, and which features in the analytics data are useful for these predictions.

It turned out to be possible to predict the demographics with good accuracy.
Gender was the easiest to predict with 77.8 % accuracy.
Age prediction with four age groups had the weighted F1 score of 0.513.
Predicting motives was more difficult, and only few of the motives were predicted more accurately than when choosing the most common motives for everyone.

The prediction accuracy depended strongly on how much content the users had viewed.
Also, the other features in the analytics data were very weak predictors for the demographics, and therefore they did not increase the prediction accuracy significantly after the user had viewed some content.
ED:2016-10-16
INSSI tietueen numero: 54675
+ lisää koriin
« edellinen | seuraava »
INSSI