Inssi

Helecon

Asiasanasto

Tenttu

haku: @keyword hidden Markov models / yhteensä: 10

hakutulos-lista

viite: 9 / 10

« edellinen | seuraava »

Tekijä:	Creutz, Mathias
Työn nimi:	Adaptering i automatisk talingenkänning
	Adaptation in automatic speech recognition
	Adaptaatio automaattisessa puheentunnistuksessa
Julkaisutyyppi:	Diplomityö
Julkaisuvuosi:	2000
Sivut:	104 Kieli: swe
Koulu/Laitos/Osasto:	Tietotekniikan osasto
Oppiaine:	Tietämystekniikka (Tik-93)
Valvoja:	Syrjänen, Markku
Ohjaaja:	Lindén, Krister
OEVS:	Sähköinen arkistokappale on luettavissa Aalto Thesis Databasen kautta. Ohje sulje Digitaalisten opinnäytteiden lukeminen Aalto-yliopiston Harald Herlin -oppimiskeskuksen suljetussa verkossa Oppimiskeskuksen suljetussa verkossa voi lukea sellaisia digitaalisia ja digitoituja opinnäytteitä, joille ei ole saatu julkaisulupaa avoimessa verkossa. Oppimiskeskuksen yhteystiedot ja aukioloajat: https://learningcentre.aalto.fi/fi/harald-herlin-oppimiskeskus/ Opinnäytteitä voi lukea Oppimiskeskuksen asiakaskoneilla, joita löytyy kaikista kerroksista. Kirjautuminen asiakaskoneille Aalto-yliopistolaiset kirjautuvat asiakaskoneille Aalto-tunnuksella ja salasanalla. Muut asiakkaat kirjautuvat asiakaskoneille yhteistunnuksilla. Opinnäytteen avaaminen Asiakaskoneiden työpöydältä löytyy kuvake: Aalto Thesis Database Kuvaketta klikkaamalla pääset hakemaan ja avaamaan etsimäsi opinnäytteen Aaltodoc-tietokannasta. Opinnäytetiedosto löytyy klikkaamalla viitetietojen OEV- tai OEVS-kentän linkkiä. Opinnäytteen lukeminen Opinnäytettä voi lukea asiakaskoneen ruudulta tai sen voi tulostaa paperille. Opinnäytetiedostoa ei voi tallentaa muistitikulle tai lähettää sähköpostilla. Opinnäytetiedoston sisältöä ei voi kopioida. Opinnäytetiedostoa ei voi muokata. Opinnäytteen tulostus Opinnäytteen voi tulostaa itselleen henkilökohtaiseen opiskelu- ja tutkimuskäyttöön. Aalto-yliopiston opiskelijat ja henkilökunta voivat tulostaa mustavalkotulosteita Oppimiskeskuksen SecurePrint-laitteille, kun tietokoneelle kirjaudutaan omilla Aalto-tunnuksilla. Väritulostus on mahdollista asiakaspalvelupisteen tulostimelle u90203-psc3. Väritulostaminen on maksullista Aalto-yliopiston opiskelijoille ja henkilökunnalle. Ulkopuoliset asiakkaat voivat tulostaa mustavalko- ja väritulosteita Oppimiskeskuksen asiakaspalvelupisteen tulostimelle u90203-psc3. Tulostaminen on maksullista.
Sijainti:	P1 Ark T80 \| Arkisto
Avainsanat:	speech recognition hidden Markov models adaptation speaker adaptation MLLR adaptation Bayesian adaptation MAP adaptation duration adaptation selection of an adaptation material with a given phonetical profile puheentunnistus kätketyt Markov-mallit adaptaatio puhuja-adaptaatio MLLR-adaptaatio bayesilainen adaptaatio MAP-adaptaatio pituusadaptaatio foneettiselta profiililtaan halutunlaisen adaptaatioaineiston valinta taligenkänning dolda Markovmodeller adaptering talaradaptering MLLR-adaptering bayesisk adaptering MAP-adaptering längdadaptering val av adapteringsmaterial med en given fonetisk profil
Tiivistelmä (fin):	Tämä diplomityö käsittelee automaattiseen puheentunnistukseen liittyvää adaptaatiota. Adaptaatio tarkoittaa olemassa olevan puheentunnistusjärjestelmän sopeuttamista uusiin olosuhteisiin, kuten uuden käyttäjän ääneen tai uudessa käyttöympäristössä esiintyvään taustakohinaan. Työssä käsitelty suomenkielinen puheentunnistusjärjestelmä perustuu kätkettyihin Markov-malleihin. Järjestelmän sopeuttamista uuteen puhujaan on tutkittu suorittamalla adaptaatiokokeita käyttäen kolmea testiääntä. Adaptaatio on tapahtunut ohjatusti sekä MLLR-adaptaatiomenetelmää että bayesilaista (MAP-)menetelmää hyväksi käyttäen. Suomenkielen äänteiden pituuserojen merkitys on otettu huomioon puheentunnistusjärjestelmässämme. Uusi adaptaatiomuoto, pituusadaptaatio, on kehitetty ja testattu. Pituusadaptaatio on tarpeellinen, jotta järjestelmää voidaan sopeuttaa uuteen puhenopeuteen. Adaptaatiossa käytetyn puheaineiston valintaa on myös tutkittu. Tavoitteena on ollut löytää aineiston optimaalinen foneettinen profiili. Foneettisella profiililla tarkoitetaan eri äänteiden esiintymien suhteellista osuutta kaikista aineistossa olevista äänteistä. Uusi dynaaminen menetelmä adaptaatioaineiston foneettisen profiilin valitsemiseksi on kehitetty ja testattu. Dynaamisen menetelmän tavoitteena on uuden puhujan äänen erityispiirteiden huomioonottaminen. Tämä tapahtuu siten, että adaptaatioaineisto sisältää suhteessa enemmän äänteitä, joita järjestelmän on vaikea tunnistaa, kuin jo varsin hyvän tunnistustarkkuuden saavuttaneita äänteitä. Tehdyt kokeet osoittavat, että adaptaatioaineiston kokoonpano vaikuttaa selvästi adaptoidun puheentunnistusjärjestelmän tunnistustarkkuuteen. Kuitenkin jää epäselväksi missä määrin adaptaatioaineiston profiilin dynaaminen valinta toimii paremmin kuin etukäteen suoritettu valinta, missä aineisto sisältää äänteitä suhteessa niiden esiintymistiheyteen kielessä. Kokeiden perusteella pituusadaptaation vaikutus ei näytä merkittävältä.
ED:	2000-10-04

INSSI tietueen numero: 15839

+ lisää koriin

« edellinen | seuraava »

INSSI