haku: @keyword hidden Markov models / yhteensä: 10
viite: 10 / 10
« edellinen | seuraava »
Tekijä: | Siivola, Vesa |
Työn nimi: | An adaptive method to achieve speaker independence in a speech recognition system |
Adaptiivinen menetelmä puhujariippumattomuuden saavuttamiseksi puheentunnistusjärjestelmässä | |
Julkaisutyyppi: | Diplomityö |
Julkaisuvuosi: | 1999 |
Sivut: | 55 Kieli: eng |
Koulu/Laitos/Osasto: | Sähkö- ja tietoliikennetekniikan osasto |
Oppiaine: | Informaatiotekniikka (Tik-61) |
Valvoja: | Oja, Erkki |
Ohjaaja: | Kurimo, Mikko |
OEVS: | Sähköinen arkistokappale on luettavissa Aalto Thesis Databasen kautta.
Ohje Digitaalisten opinnäytteiden lukeminen Aalto-yliopiston Harald Herlin -oppimiskeskuksen suljetussa verkossaOppimiskeskuksen suljetussa verkossa voi lukea sellaisia digitaalisia ja digitoituja opinnäytteitä, joille ei ole saatu julkaisulupaa avoimessa verkossa. Oppimiskeskuksen yhteystiedot ja aukioloajat: https://learningcentre.aalto.fi/fi/harald-herlin-oppimiskeskus/ Opinnäytteitä voi lukea Oppimiskeskuksen asiakaskoneilla, joita löytyy kaikista kerroksista.
Kirjautuminen asiakaskoneille
Opinnäytteen avaaminen
Opinnäytteen lukeminen
Opinnäytteen tulostus
|
Sijainti: | P1 Ark S80 | Arkisto |
Avainsanat: | speech recognition speaker adaptation speaker compensation hidden Markov models self-organizing map features of speech puheentunnistus puhuja-adaptaatio puhujan kompensoiminen kätketyt Markov-mallit itseorganisoituva kartta puheen piirteet |
Tiivistelmä (fin): | Tässä diplomityössä etsitään tapoja parantaa puheentunnistimen tarkkuutta, kun tunnistinta ei ole opetettu käyttäjän puheella. Työssä tarkastellaan useita tapoja vaikuttaa tähän, alkaen tunnistimen perusmallin valinnasta tekniikoihin, joilla yritetään vähentää taustakohinan vaikutusta ja mukauttaa eli adaptoida puheen malli käyttäjän puhetyylin mukaan. Sekä kohinan kompensointi että mallin mukauttaminen tapahtuu laitetta käytettäessä, eikä mitään opetusistuntoa vaadita. Nämä ominaisuudet ovat tärkeitä, kun yritetään tehdä julkista palvelua, kuten esimerkiksi automaattista lennonvarausjärjestelmää, eikä käyttäjää voida vaivata opetusistunnolla. Työssä käytetty tunnistin perustuu kätkettyihin Markov-malleihin. Tunnistimen perusrakenneyksikkönä kokeillaan yhden foneemin sijasta käyttää siirtymää yhdestä foneemista toiseen ja huomataan, että jälkimmäinen toimii paremmin vastaavalla määrällä parametrejä. Kepstrien keskiarvojen normalisoinnilla yritetään kompensoida tekijöitä, jotka muuttavat irrotettuja piirteitä konsistentisti. Tämä menetelmä toimii kohtuullisen hyvin. Puheen mallin adaptoimiseen käytetty algoritmi johdetaan maksimi a posteriori -adaptoinnista ja itseorganisoituvista kartoista. Adaptaatio toimii hyvin yhden foneemin mallilla, mutta foneemien siirtymiä käytettäessä tulokset eivät juurikaan parane syistä, jotka esitetään työssä. |
ED: | 1999-09-28 |
INSSI tietueen numero: 14795
+ lisää koriin
« edellinen | seuraava »
INSSI