Inssi

Helecon

Vocabulary

Tenttu

search query: @keyword hidden Markov models / total: 10

reference: 8 / 10

« previous | next »

Author:	Ursin, Markku
Title:	Triphone clustering in Finnish continuous speech recognition
	Trifoniklusterointi suomenkielisessä jatkuvassa puheentunnistuksessa
Publication type:	Master's thesis
Publication year:	2002
Pages:	125 Language: eng
Department/School:	Tietotekniikan osasto
Main subject:	Informaatiotekniikka (Tik-61)
Supervisor:	Kurimo, Mikko
Instructor:	Laine, Unto K.
Digitized copy:	https://aaltodoc.aalto.fi/handle/123456789/90116
OEVS:	Digitized archive copy is available in Aaltodoc
Location:	P1 Ark Aalto \| Archive
Keywords:	speech recognition phonemic speech recognition context-dependency triphones triphone clustering hidden Markov models HMM puheentunnistus foneeminen puheentunnistus kontekstiriippuvuus trifonit trifinien klusterointi kätketyt Markov-mallit
Abstract (fin):	Tässä diplomityössä tutkitaan kontekstiriippuvien foneemimallien (trifonien) käyttöä suomenkielisen puhujariippuvan jatkuvan puheen tunnistimessa. Työn ensimmäisessä osassa tarkastellaan ihmisen puheentuotto- ja kuulojärjestelmiä, suomen kielen ominaisuuksia puheentunnistuksen kannalta sekä esitellään puheentunnistusjärjestelmien yleinen rakenne ja toiminta. Selostuksessa painotetaan foneemien kontekstiriippuvuutta sekä koartikulatorisia efektejä. Työn toisessa osassa opetetaan puhujariippuva tunnistin käyttäen kätkettyjä Markov-malleja (HMM) sekä Hidden Markov Model Toolkit (HTK)-ohjelmistoa. Trifoniklusteroinnissa kokeillaan datalähtöistä binääriseen päätöspuuhun perustuvaa menetelmää sekä menetelmiä, jotka käyttävät hyväkseen tietoa foneemien äännetyypeistä sekä ääntämispaikoista. Parhaat tunnistustulokset saavutetaan puuklusterointimenetelmällä, jolloin myös malleja on suurin määrä. Tunnistuskokeiden virheitä tarkastellaan laajasti. Foneemikohtaiset tyypilliset virheet ja eniten virheitä tuottaneet kontekstit analysoidaan.
ED:	2002-10-08

INSSI record number: 18992

« previous | next »

INSSI