search query: @keyword hidden Markov models / total: 10
reference: 8 / 10
Author: | Ursin, Markku |
Title: | Triphone clustering in Finnish continuous speech recognition |
Trifoniklusterointi suomenkielisessä jatkuvassa puheentunnistuksessa | |
Publication type: | Master's thesis |
Publication year: | 2002 |
Pages: | 125 Language: eng |
Department/School: | Tietotekniikan osasto |
Main subject: | Informaatiotekniikka (Tik-61) |
Supervisor: | Kurimo, Mikko |
Instructor: | Laine, Unto K. |
Digitized copy: | https://aaltodoc.aalto.fi/handle/123456789/90116 |
OEVS: | Digitized archive copy is available in Aaltodoc
|
Location: | P1 Ark Aalto | Archive |
Keywords: | speech recognition phonemic speech recognition context-dependency triphones triphone clustering hidden Markov models HMM puheentunnistus foneeminen puheentunnistus kontekstiriippuvuus trifonit trifinien klusterointi kätketyt Markov-mallit |
Abstract (fin): | Tässä diplomityössä tutkitaan kontekstiriippuvien foneemimallien (trifonien) käyttöä suomenkielisen puhujariippuvan jatkuvan puheen tunnistimessa. Työn ensimmäisessä osassa tarkastellaan ihmisen puheentuotto- ja kuulojärjestelmiä, suomen kielen ominaisuuksia puheentunnistuksen kannalta sekä esitellään puheentunnistusjärjestelmien yleinen rakenne ja toiminta. Selostuksessa painotetaan foneemien kontekstiriippuvuutta sekä koartikulatorisia efektejä. Työn toisessa osassa opetetaan puhujariippuva tunnistin käyttäen kätkettyjä Markov-malleja (HMM) sekä Hidden Markov Model Toolkit (HTK)-ohjelmistoa. Trifoniklusteroinnissa kokeillaan datalähtöistä binääriseen päätöspuuhun perustuvaa menetelmää sekä menetelmiä, jotka käyttävät hyväkseen tietoa foneemien äännetyypeistä sekä ääntämispaikoista. Parhaat tunnistustulokset saavutetaan puuklusterointimenetelmällä, jolloin myös malleja on suurin määrä. Tunnistuskokeiden virheitä tarkastellaan laajasti. Foneemikohtaiset tyypilliset virheet ja eniten virheitä tuottaneet kontekstit analysoidaan. |
ED: | 2002-10-08 |
INSSI record number: 18992
+ add basket
INSSI