search query: @keyword speech recognition / total: 24
reference: 19 / 24
« previous | next »
Author:Ursin, Markku
Title:Triphone clustering in Finnish continuous speech recognition
Trifoniklusterointi suomenkielisessä jatkuvassa puheentunnistuksessa
Publication type:Master's thesis
Publication year:2002
Pages:125      Language:   eng
Department/School:Tietotekniikan osasto
Main subject:Informaatiotekniikka   (Tik-61)
Supervisor:Kurimo, Mikko
Instructor:Laine, Unto K.
Digitized copy: https://aaltodoc.aalto.fi/handle/123456789/90116
OEVS:
Digitized archive copy is available in Aaltodoc
Location:P1 Ark Aalto     | Archive
Keywords:speech recognition
phonemic speech recognition
context-dependency
triphones
triphone clustering
hidden Markov models
HMM
puheentunnistus
foneeminen puheentunnistus
kontekstiriippuvuus
trifonit
trifinien klusterointi
kätketyt Markov-mallit
Abstract (fin):Tässä diplomityössä tutkitaan kontekstiriippuvien foneemimallien (trifonien) käyttöä suomenkielisen puhujariippuvan jatkuvan puheen tunnistimessa.
Työn ensimmäisessä osassa tarkastellaan ihmisen puheentuotto- ja kuulojärjestelmiä, suomen kielen ominaisuuksia puheentunnistuksen kannalta sekä esitellään puheentunnistusjärjestelmien yleinen rakenne ja toiminta.
Selostuksessa painotetaan foneemien kontekstiriippuvuutta sekä koartikulatorisia efektejä.

Työn toisessa osassa opetetaan puhujariippuva tunnistin käyttäen kätkettyjä Markov-malleja (HMM) sekä Hidden Markov Model Toolkit (HTK)-ohjelmistoa.
Trifoniklusteroinnissa kokeillaan datalähtöistä binääriseen päätöspuuhun perustuvaa menetelmää sekä menetelmiä, jotka käyttävät hyväkseen tietoa foneemien äännetyypeistä sekä ääntämispaikoista.
Parhaat tunnistustulokset saavutetaan puuklusterointimenetelmällä, jolloin myös malleja on suurin määrä.

Tunnistuskokeiden virheitä tarkastellaan laajasti.
Foneemikohtaiset tyypilliset virheet ja eniten virheitä tuottaneet kontekstit analysoidaan.
ED:2002-10-08
INSSI record number: 18992
+ add basket
« previous | next »
INSSI