haku: @keyword hidden Markov models / yhteensä: 10
viite: 9 / 10
Tekijä: | Creutz, Mathias |
Työn nimi: | Adaptering i automatisk talingenkänning |
Adaptation in automatic speech recognition | |
Adaptaatio automaattisessa puheentunnistuksessa | |
Julkaisutyyppi: | Diplomityö |
Julkaisuvuosi: | 2000 |
Sivut: | 104 Kieli: swe |
Koulu/Laitos/Osasto: | Tietotekniikan osasto |
Oppiaine: | Tietämystekniikka (Tik-93) |
Valvoja: | Syrjänen, Markku |
Ohjaaja: | Lindén, Krister |
OEVS: | Sähköinen arkistokappale on luettavissa Aalto Thesis Databasen kautta.
Ohje Digitaalisten opinnäytteiden lukeminen Aalto-yliopiston Harald Herlin -oppimiskeskuksen suljetussa verkossaOppimiskeskuksen suljetussa verkossa voi lukea sellaisia digitaalisia ja digitoituja opinnäytteitä, joille ei ole saatu julkaisulupaa avoimessa verkossa. Oppimiskeskuksen yhteystiedot ja aukioloajat: https://learningcentre.aalto.fi/fi/harald-herlin-oppimiskeskus/ Opinnäytteitä voi lukea Oppimiskeskuksen asiakaskoneilla, joita löytyy kaikista kerroksista.
Kirjautuminen asiakaskoneille
Opinnäytteen avaaminen
Opinnäytteen lukeminen
Opinnäytteen tulostus
|
Sijainti: | P1 Ark T80 | Arkisto |
Avainsanat: | speech recognition hidden Markov models adaptation speaker adaptation MLLR adaptation Bayesian adaptation MAP adaptation duration adaptation selection of an adaptation material with a given phonetical profile puheentunnistus kätketyt Markov-mallit adaptaatio puhuja-adaptaatio MLLR-adaptaatio bayesilainen adaptaatio MAP-adaptaatio pituusadaptaatio foneettiselta profiililtaan halutunlaisen adaptaatioaineiston valinta taligenkänning dolda Markovmodeller adaptering talaradaptering MLLR-adaptering bayesisk adaptering MAP-adaptering längdadaptering val av adapteringsmaterial med en given fonetisk profil |
Tiivistelmä (fin): | Tämä diplomityö käsittelee automaattiseen puheentunnistukseen liittyvää adaptaatiota. Adaptaatio tarkoittaa olemassa olevan puheentunnistusjärjestelmän sopeuttamista uusiin olosuhteisiin, kuten uuden käyttäjän ääneen tai uudessa käyttöympäristössä esiintyvään taustakohinaan. Työssä käsitelty suomenkielinen puheentunnistusjärjestelmä perustuu kätkettyihin Markov-malleihin. Järjestelmän sopeuttamista uuteen puhujaan on tutkittu suorittamalla adaptaatiokokeita käyttäen kolmea testiääntä. Adaptaatio on tapahtunut ohjatusti sekä MLLR-adaptaatiomenetelmää että bayesilaista (MAP-)menetelmää hyväksi käyttäen. Suomenkielen äänteiden pituuserojen merkitys on otettu huomioon puheentunnistusjärjestelmässämme. Uusi adaptaatiomuoto, pituusadaptaatio, on kehitetty ja testattu. Pituusadaptaatio on tarpeellinen, jotta järjestelmää voidaan sopeuttaa uuteen puhenopeuteen. Adaptaatiossa käytetyn puheaineiston valintaa on myös tutkittu. Tavoitteena on ollut löytää aineiston optimaalinen foneettinen profiili. Foneettisella profiililla tarkoitetaan eri äänteiden esiintymien suhteellista osuutta kaikista aineistossa olevista äänteistä. Uusi dynaaminen menetelmä adaptaatioaineiston foneettisen profiilin valitsemiseksi on kehitetty ja testattu. Dynaamisen menetelmän tavoitteena on uuden puhujan äänen erityispiirteiden huomioonottaminen. Tämä tapahtuu siten, että adaptaatioaineisto sisältää suhteessa enemmän äänteitä, joita järjestelmän on vaikea tunnistaa, kuin jo varsin hyvän tunnistustarkkuuden saavuttaneita äänteitä. Tehdyt kokeet osoittavat, että adaptaatioaineiston kokoonpano vaikuttaa selvästi adaptoidun puheentunnistusjärjestelmän tunnistustarkkuuteen. Kuitenkin jää epäselväksi missä määrin adaptaatioaineiston profiilin dynaaminen valinta toimii paremmin kuin etukäteen suoritettu valinta, missä aineisto sisältää äänteitä suhteessa niiden esiintymistiheyteen kielessä. Kokeiden perusteella pituusadaptaation vaikutus ei näytä merkittävältä. |
ED: | 2000-10-04 |
INSSI tietueen numero: 15839
+ lisää koriin
INSSI