search query: @keyword automaattinen puheentunnistus / total: 8
reference: 8 / 8
« previous | next »
Author:Varjokallio, Matti
Title:Subspace Methods for Gaussian Mixture Models in Automatic Speech Recognition
Aliavaruusmenetelmiä Gaussin mikstuurimalleille automaattisessa puheentunnistuksessa
Publication type:Master's thesis
Publication year:2007
Pages:76 s. + liitt. 5      Language:   eng
Department/School:Sähkö- ja tietoliikennetekniikan osasto
Main subject:Informaatiotekniikka   (T-61)
Supervisor:Oja, Erkki
Instructor:Kurimo, Mikko
OEVS:
Electronic archive copy is available via Aalto Thesis Database.
Instructions

Reading digital theses in the closed network of the Aalto University Harald Herlin Learning Centre

In the closed network of Learning Centre you can read digital and digitized theses not available in the open network.

The Learning Centre contact details and opening hours: https://learningcentre.aalto.fi/en/harald-herlin-learning-centre/

You can read theses on the Learning Centre customer computers, which are available on all floors.

Logging on to the customer computers

  • Aalto University staff members log on to the customer computer using the Aalto username and password.
  • Other customers log on using a shared username and password.

Opening a thesis

  • On the desktop of the customer computers, you will find an icon titled:

    Aalto Thesis Database

  • Click on the icon to search for and open the thesis you are looking for from Aaltodoc database. You can find the thesis file by clicking the link on the OEV or OEVS field.

Reading the thesis

  • You can either print the thesis or read it on the customer computer screen.
  • You cannot save the thesis file on a flash drive or email it.
  • You cannot copy text or images from the file.
  • You cannot edit the file.

Printing the thesis

  • You can print the thesis for your personal study or research use.
  • Aalto University students and staff members may print black-and-white prints on the PrintingPoint devices when using the computer with personal Aalto username and password. Color printing is possible using the printer u90203-psc3, which is located near the customer service. Color printing is subject to a charge to Aalto University students and staff members.
  • Other customers can use the printer u90203-psc3. All printing is subject to a charge to non-University members.
Location:P1 Ark S80     | Archive
Keywords:automatic speech recognition
acoustic modeling
Gaussian mixture model
multivariate normal distribution
subspace method
automaattinen puheentunnistus
akustinen mallinnus
Gaussin mikstuurimalli
moniulotteinen normaalijakauma
aliavaruusmenetelmä
Abstract (fin):Laadukas akustinen mallinnus on yksi keskeinen tekijä puheentunnistuksessa.
Puhesignaalista lasketaan tyypillisesti korkeaulotteisia piirrevektoreja, joihin yritetään tiivistää puheentunnistuksen kannalta oleellinen tieto.
Tyypillisin menetelmä puheen akustiikan mallinnukseen on kätketty Markov-malli, jossa tilojen emissiotodennäköisyysjakaumat ovat piirrevektoreihin sovitettuja Gaussin mikstuurimalleja.

Piirrevektorin komponenttien välinen tilastollinen riippumattomuus helpottaa jakaumien mallinnusta.
Perinteisesti tämä ominaisuus on oletettu piirrevektoreista, koska tässä tapauksessa mikstuurimalli piirteiden jakaumalle on helpompi opettaa ja akustisten todennäköisyyksien laskeminen nopeutuu.

Oletus tilastollisesta riippumattomuudesta pätee koko järjestelmän tasolla kohtalaisesti, mutta tilatasolla piirteiden väliset riippuvuudet voivat olla suuriakin.
Tässä työssä tutkitaankin menetelmiä, joissa Gaussin parametreja mallinnetaan koko järjestelmälle yhteisessä aliavaruudessa.
Tällaiset menetelmät säilyttävät kyvyn mallintaa piirteiden välisiä riippuvuuksia kuitenkin mahdollistaen pienen parametrimäärän ja pitäen todennäköisyyksien laskemisen edullisena.

Menetelmiä testattiin sekä suomenkielisessä että englanninkielisessä laajan sanaston jatkuvassa puheentunnistuksessa.
Molemmilla kielillä löydettiin erilaisia malliyhdistelmiä, jotka samoilla parametrimäärillä baseline-tuloksiin verrattaessa paransivat tunnistustarkkuutta huomattavasti tai vastaavasti saavuttivat saman tunnistustarkkuuden vähemmällä parametrimäärällä.
ED:2007-05-18
INSSI record number: 33976
+ add basket
« previous | next »
INSSI