search query: @instructor Syrjänen, Markku / total: 8
reference: 3 / 8
Author: | Fiskari, Jukka |
Title: | Vahvistusoppiminen pokerissa |
Reinforcement Learning in Poker | |
Publication type: | Master's thesis |
Publication year: | 2004 |
Pages: | 57 Language: fin |
Department/School: | Tietotekniikan osasto |
Main subject: | Tietämystekniikka (T-93) |
Supervisor: | Syrjänen, Markku |
Instructor: | Syrjänen, Markku |
OEVS: | Electronic archive copy is available via Aalto Thesis Database.
Instructions Reading digital theses in the closed network of the Aalto University Harald Herlin Learning CentreIn the closed network of Learning Centre you can read digital and digitized theses not available in the open network. The Learning Centre contact details and opening hours: https://learningcentre.aalto.fi/en/harald-herlin-learning-centre/ You can read theses on the Learning Centre customer computers, which are available on all floors.
Logging on to the customer computers
Opening a thesis
Reading the thesis
Printing the thesis
|
Location: | P1 Ark V80 | Archive |
Abstract (fin): | Pokeri on mielenkiintoinen tutkimuskohde tekoälylle. Pokerin saannot ovat yksinkertaiset ja helposti opittavat, mutta se on pelinä monimutkainen ja vaikeasti hallittava. Useissa muissa peleissä pelaajilla on mahdollisuus tietää pelin nykyinen tila, koska kaikki tarvittava informaatio on näkyvillä. Pokeri on tässä suhteessa erilainen, koska se on epätäydellisen informaation peli, jossa pelaaja joutuu tekemään monimutkaisia päätöksiä tuntematta pelin tilaa, koska vastustajan kortit eivät ole tiedossa. Parhaat ihmispelaajat voittavat helposti tämän hetken parhaimmat pokeria pelaavat tietokoneohjelmat. Näin ei ole useissa muissa peleissä, jotka perustuvat täydelliseen informaatioon, kuten tammipeli ja backgammon. Tämän hetken paras pokeria pelaava tietokoneohjelma perustuu peliteoriaan, jonka heikkous on kyvyttömyys oppia vastustajan virheistä. Työ keskittyy pokeripeliin, jota kutsutaan nimellä Split-Limit Texas Hold' em ja sen kahden pelaajan versioon. Vahvistusoppimista apuna käyttäen kehitettiin ohjelma, joka pelaa tätä kyseistä pokeripeliä. Ohjelma näyttää, että oppiminen on mahdollista itsensä kopiota vastaan pelatessa ja että se pystyy jatkamaan oppimista edelleen pelatessa muita vastustajia vastaan. Ohjelma voitti tämän hetken parhaan pokeriohjelman pienellä marginaalilla, saavutettuaan maksimaallisen suorituskyvyn vahvistusoppimista käyttäen. |
ED: | 2004-10-27 |
INSSI record number: 26435
+ add basket
INSSI