haku: @instructor Lindén, Krister / yhteensä: 4
viite: 3 / 4
Tekijä:Creutz, Mathias
Työn nimi:Adaptering i automatisk talingenkänning
Adaptation in automatic speech recognition
Adaptaatio automaattisessa puheentunnistuksessa
Julkaisutyyppi:Diplomityö
Julkaisuvuosi:2000
Sivut:104      Kieli:   swe
Koulu/Laitos/Osasto:Tietotekniikan osasto
Oppiaine:Tietämystekniikka   (Tik-93)
Valvoja:Syrjänen, Markku
Ohjaaja:Lindén, Krister
OEVS:
Sähköinen arkistokappale on luettavissa Aalto Thesis Databasen kautta.
Ohje

Digitaalisten opinnäytteiden lukeminen Aalto-yliopiston Harald Herlin -oppimiskeskuksen suljetussa verkossa

Oppimiskeskuksen suljetussa verkossa voi lukea sellaisia digitaalisia ja digitoituja opinnäytteitä, joille ei ole saatu julkaisulupaa avoimessa verkossa.

Oppimiskeskuksen yhteystiedot ja aukioloajat: https://learningcentre.aalto.fi/fi/harald-herlin-oppimiskeskus/

Opinnäytteitä voi lukea Oppimiskeskuksen asiakaskoneilla, joita löytyy kaikista kerroksista.

Kirjautuminen asiakaskoneille

  • Aalto-yliopistolaiset kirjautuvat asiakaskoneille Aalto-tunnuksella ja salasanalla.
  • Muut asiakkaat kirjautuvat asiakaskoneille yhteistunnuksilla.

Opinnäytteen avaaminen

  • Asiakaskoneiden työpöydältä löytyy kuvake:

    Aalto Thesis Database

  • Kuvaketta klikkaamalla pääset hakemaan ja avaamaan etsimäsi opinnäytteen Aaltodoc-tietokannasta. Opinnäytetiedosto löytyy klikkaamalla viitetietojen OEV- tai OEVS-kentän linkkiä.

Opinnäytteen lukeminen

  • Opinnäytettä voi lukea asiakaskoneen ruudulta tai sen voi tulostaa paperille.
  • Opinnäytetiedostoa ei voi tallentaa muistitikulle tai lähettää sähköpostilla.
  • Opinnäytetiedoston sisältöä ei voi kopioida.
  • Opinnäytetiedostoa ei voi muokata.

Opinnäytteen tulostus

  • Opinnäytteen voi tulostaa itselleen henkilökohtaiseen opiskelu- ja tutkimuskäyttöön.
  • Aalto-yliopiston opiskelijat ja henkilökunta voivat tulostaa mustavalkotulosteita Oppimiskeskuksen SecurePrint-laitteille, kun tietokoneelle kirjaudutaan omilla Aalto-tunnuksilla. Väritulostus on mahdollista asiakaspalvelupisteen tulostimelle u90203-psc3. Väritulostaminen on maksullista Aalto-yliopiston opiskelijoille ja henkilökunnalle.
  • Ulkopuoliset asiakkaat voivat tulostaa mustavalko- ja väritulosteita Oppimiskeskuksen asiakaspalvelupisteen tulostimelle u90203-psc3. Tulostaminen on maksullista.
Sijainti:P1 Ark T80     | Arkisto
Avainsanat:speech recognition
hidden Markov models
adaptation
speaker adaptation
MLLR adaptation
Bayesian adaptation
MAP adaptation
duration adaptation
selection of an adaptation material with a given phonetical profile
puheentunnistus
kätketyt Markov-mallit
adaptaatio
puhuja-adaptaatio
MLLR-adaptaatio
bayesilainen adaptaatio
MAP-adaptaatio
pituusadaptaatio
foneettiselta profiililtaan halutunlaisen adaptaatioaineiston valinta
taligenkänning
dolda Markovmodeller
adaptering
talaradaptering
MLLR-adaptering
bayesisk adaptering
MAP-adaptering
längdadaptering
val av adapteringsmaterial med en given fonetisk profil
Tiivistelmä (fin):Tämä diplomityö käsittelee automaattiseen puheentunnistukseen liittyvää adaptaatiota.
Adaptaatio tarkoittaa olemassa olevan puheentunnistusjärjestelmän sopeuttamista uusiin olosuhteisiin, kuten uuden käyttäjän ääneen tai uudessa käyttöympäristössä esiintyvään taustakohinaan.

Työssä käsitelty suomenkielinen puheentunnistusjärjestelmä perustuu kätkettyihin Markov-malleihin.
Järjestelmän sopeuttamista uuteen puhujaan on tutkittu suorittamalla adaptaatiokokeita käyttäen kolmea testiääntä.
Adaptaatio on tapahtunut ohjatusti sekä MLLR-adaptaatiomenetelmää että bayesilaista (MAP-)menetelmää hyväksi käyttäen.

Suomenkielen äänteiden pituuserojen merkitys on otettu huomioon puheentunnistusjärjestelmässämme.
Uusi adaptaatiomuoto, pituusadaptaatio, on kehitetty ja testattu.
Pituusadaptaatio on tarpeellinen, jotta järjestelmää voidaan sopeuttaa uuteen puhenopeuteen.

Adaptaatiossa käytetyn puheaineiston valintaa on myös tutkittu.
Tavoitteena on ollut löytää aineiston optimaalinen foneettinen profiili.
Foneettisella profiililla tarkoitetaan eri äänteiden esiintymien suhteellista osuutta kaikista aineistossa olevista äänteistä.
Uusi dynaaminen menetelmä adaptaatioaineiston foneettisen profiilin valitsemiseksi on kehitetty ja testattu.
Dynaamisen menetelmän tavoitteena on uuden puhujan äänen erityispiirteiden huomioonottaminen.
Tämä tapahtuu siten, että adaptaatioaineisto sisältää suhteessa enemmän äänteitä, joita järjestelmän on vaikea tunnistaa, kuin jo varsin hyvän tunnistustarkkuuden saavuttaneita äänteitä.

Tehdyt kokeet osoittavat, että adaptaatioaineiston kokoonpano vaikuttaa selvästi adaptoidun puheentunnistusjärjestelmän tunnistustarkkuuteen.
Kuitenkin jää epäselväksi missä määrin adaptaatioaineiston profiilin dynaaminen valinta toimii paremmin kuin etukäteen suoritettu valinta, missä aineisto sisältää äänteitä suhteessa niiden esiintymistiheyteen kielessä.
Kokeiden perusteella pituusadaptaation vaikutus ei näytä merkittävältä.
ED:2000-10-04
INSSI tietueen numero: 15839
+ lisää koriin
INSSI