search query: @keyword hidden Markov models / total: 10
reference: 10 / 10
« previous | next »
Author: | Siivola, Vesa |
Title: | An adaptive method to achieve speaker independence in a speech recognition system |
Adaptiivinen menetelmä puhujariippumattomuuden saavuttamiseksi puheentunnistusjärjestelmässä | |
Publication type: | Master's thesis |
Publication year: | 1999 |
Pages: | 55 Language: eng |
Department/School: | Sähkö- ja tietoliikennetekniikan osasto |
Main subject: | Informaatiotekniikka (Tik-61) |
Supervisor: | Oja, Erkki |
Instructor: | Kurimo, Mikko |
OEVS: | Electronic archive copy is available via Aalto Thesis Database.
Instructions Reading digital theses in the closed network of the Aalto University Harald Herlin Learning CentreIn the closed network of Learning Centre you can read digital and digitized theses not available in the open network. The Learning Centre contact details and opening hours: https://learningcentre.aalto.fi/en/harald-herlin-learning-centre/ You can read theses on the Learning Centre customer computers, which are available on all floors.
Logging on to the customer computers
Opening a thesis
Reading the thesis
Printing the thesis
|
Location: | P1 Ark S80 | Archive |
Keywords: | speech recognition speaker adaptation speaker compensation hidden Markov models self-organizing map features of speech puheentunnistus puhuja-adaptaatio puhujan kompensoiminen kätketyt Markov-mallit itseorganisoituva kartta puheen piirteet |
Abstract (fin): | Tässä diplomityössä etsitään tapoja parantaa puheentunnistimen tarkkuutta, kun tunnistinta ei ole opetettu käyttäjän puheella. Työssä tarkastellaan useita tapoja vaikuttaa tähän, alkaen tunnistimen perusmallin valinnasta tekniikoihin, joilla yritetään vähentää taustakohinan vaikutusta ja mukauttaa eli adaptoida puheen malli käyttäjän puhetyylin mukaan. Sekä kohinan kompensointi että mallin mukauttaminen tapahtuu laitetta käytettäessä, eikä mitään opetusistuntoa vaadita. Nämä ominaisuudet ovat tärkeitä, kun yritetään tehdä julkista palvelua, kuten esimerkiksi automaattista lennonvarausjärjestelmää, eikä käyttäjää voida vaivata opetusistunnolla. Työssä käytetty tunnistin perustuu kätkettyihin Markov-malleihin. Tunnistimen perusrakenneyksikkönä kokeillaan yhden foneemin sijasta käyttää siirtymää yhdestä foneemista toiseen ja huomataan, että jälkimmäinen toimii paremmin vastaavalla määrällä parametrejä. Kepstrien keskiarvojen normalisoinnilla yritetään kompensoida tekijöitä, jotka muuttavat irrotettuja piirteitä konsistentisti. Tämä menetelmä toimii kohtuullisen hyvin. Puheen mallin adaptoimiseen käytetty algoritmi johdetaan maksimi a posteriori -adaptoinnista ja itseorganisoituvista kartoista. Adaptaatio toimii hyvin yhden foneemin mallilla, mutta foneemien siirtymiä käytettäessä tulokset eivät juurikaan parane syistä, jotka esitetään työssä. |
ED: | 1999-09-28 |
INSSI record number: 14795
+ add basket
« previous | next »
INSSI