Author:Purhonen, Juha
Title:Koripallo-otteluiden lopputulosten ennustaminen ottelutilastojen perusteella
Predicting outcomes of basketball games based on box score statistics
Publication type:Master's thesis
Publication year:2010
Pages:[10] + 62      Language:   fin
Department/School:Informaatio- ja luonnontieteiden tiedekunta
Main subject:Laskennallinen tekniikka   (S-114)
Supervisor:Lampinen, Jouko
Instructor:Lampinen, Jouko
Location:P1 Ark Aalto     | Archive
Bayesian inference
Kalman filter
multiple model approach
state space model
bayesiläinen päättely
usean mallin lähestymistapa
Abstract (eng): This thesis is about predicting the outcomes of basketball games.
In earlier studies, several methods have been proposed for predicting the outcomes based on the outcomes of the previously played games.
However, the outcomes of the games are heavily affected by chance.
Therefore, it is possible that in addition to the points scored by the teams, other statistics listed in the so called box score provide additional information about the relative strengths of the teams.
The goal of this thesis is to determine whether the other statistics should be taken into consideration in the predictions.

The study consists of two phases.
In the first phase, the relative strengths of the teams for different aspects of the game at each time step are measured by estimating the so called power ratings.
The relationship between the power ratings and the box score statistics is modelled using a linear Gaussian state space model, which enabies the estimation of the power ratings using methods based on the Kalman filter.
In the second phase of the thesis, the relationship between the power rating estimates and the outcomes is studied using linear regression analysis.

The method is applied for the games played during the NBA regular seasons 2004- 2009.
The results of the study suggest that, in addition to the outcomes of the previously played games, the number of assists and missed field goal attempts should be also taken into account in the predictions.
However, inclusion of these two statistics has a very moderate effect on the predictions given by the model.
Abstract (fin): Tämä diplomityö käsittelee koripallo-otteluiden lopputulosten ennustamista.
Aiemmissa aihetta käsittelevissä tutkimuksissa on esitelty erilaisia menetelmiä lopputulosten ennustamiseen aiemmin sarjassa pelattujen otteluiden lopputulosten perusteella.
Sattuma vaikuttaa kuitenkin merkittävästi otteluiden lopputuloksiin, joten on mahdollista, että muut ottelutilastot antavat lisäinformaatiota joukkueiden välisistä tasoeroista.
Tämän työn tavoitteena on selvittää, kannattaako lopputulosten ennustamisessa huomioida aiempien lopputulosten lisäksi myös muuta ottelukohtaisessa tilastokokoelmassa listattua informaatiota.

Työ koostuu kahdesta vaiheesta.
Työn ensimmäisessä vaiheessa sarjan joukkueiden tasoa eri ajanhetkinä ja pelin eri osa-alueilla mitataan estimoimalla niin kutsuttuja voimalukuja.
Voimalukujen ja ottelutilastojen välistä yhteyttä kuvataan lineaaris-gaussisen tila-avaruusmallin avulla, mikä mahdollistaa voimalukujen estimoinnin Kalman-suotimeen perustuvilla menetelmillä.
Työn toisessa vaiheessa tutkitaan eri ottelutilastojen perusteella laskettujen voimalukuestimaattien yhteyttä otteluiden lopputuloksiin lineaarisen regressioanalyysin avulla.

Menetelmää sovelletaan NBA-sarjassa kausien 2004-2009 aikana pelattuihin runkosarjaotteluihin.
Työn tulokset viittaavat siihen, että koripallotulosten ennustamisessa kannattaisi huomioida aiempien otteluiden pisteiden lisäksi myös koriin johtaneiden syöttöjen ja epäonnistuneiden pelitilanneheittojen lukumäärät.
Kyseisten ottelutilastojen huomiointi vaikuttaa kuitenkin vain melko vähän mallin tuottamiin ennusteisiin.
INSSI record number: 40341
