haku: @instructor Laine, Unto K. / yhteensä: 4
viite: 2 / 4
Tekijä:Ursin, Markku
Työn nimi:Triphone clustering in Finnish continuous speech recognition
Trifoniklusterointi suomenkielisessä jatkuvassa puheentunnistuksessa
Julkaisutyyppi:Diplomityö
Julkaisuvuosi:2002
Sivut:125      Kieli:   eng
Koulu/Laitos/Osasto:Tietotekniikan osasto
Oppiaine:Informaatiotekniikka   (Tik-61)
Valvoja:Kurimo, Mikko
Ohjaaja:Laine, Unto K.
Digitoitu julkaisu: https://aaltodoc.aalto.fi/handle/123456789/90116
OEVS:
Digitoitu arkistokappale on julkaistu Aaltodocissa
Sijainti:P1 Ark Aalto     | Arkisto
Avainsanat:speech recognition
phonemic speech recognition
context-dependency
triphones
triphone clustering
hidden Markov models
HMM
puheentunnistus
foneeminen puheentunnistus
kontekstiriippuvuus
trifonit
trifinien klusterointi
kätketyt Markov-mallit
Tiivistelmä (fin):Tässä diplomityössä tutkitaan kontekstiriippuvien foneemimallien (trifonien) käyttöä suomenkielisen puhujariippuvan jatkuvan puheen tunnistimessa.
Työn ensimmäisessä osassa tarkastellaan ihmisen puheentuotto- ja kuulojärjestelmiä, suomen kielen ominaisuuksia puheentunnistuksen kannalta sekä esitellään puheentunnistusjärjestelmien yleinen rakenne ja toiminta.
Selostuksessa painotetaan foneemien kontekstiriippuvuutta sekä koartikulatorisia efektejä.

Työn toisessa osassa opetetaan puhujariippuva tunnistin käyttäen kätkettyjä Markov-malleja (HMM) sekä Hidden Markov Model Toolkit (HTK)-ohjelmistoa.
Trifoniklusteroinnissa kokeillaan datalähtöistä binääriseen päätöspuuhun perustuvaa menetelmää sekä menetelmiä, jotka käyttävät hyväkseen tietoa foneemien äännetyypeistä sekä ääntämispaikoista.
Parhaat tunnistustulokset saavutetaan puuklusterointimenetelmällä, jolloin myös malleja on suurin määrä.

Tunnistuskokeiden virheitä tarkastellaan laajasti.
Foneemikohtaiset tyypilliset virheet ja eniten virheitä tuottaneet kontekstit analysoidaan.
ED:2002-10-08
INSSI tietueen numero: 18992
+ lisää koriin
INSSI