haku: @keyword speech / yhteensä: 10
viite: 1 / 10
« edellinen | seuraava »
Tekijä: | Macías Ojeda, Antonio |
Työn nimi: | Speaker Diarization |
Julkaisutyyppi: | Diplomityö |
Julkaisuvuosi: | 2014 |
Sivut: | ix + 30 Kieli: eng |
Koulu/Laitos/Osasto: | Perustieteiden korkeakoulu |
Oppiaine: | Machine Learning and Data Mining (SCI3015) |
Valvoja: | Kurimo, Mikko |
Ohjaaja: | |
Elektroninen julkaisu: | http://urn.fi/URN:NBN:fi:aalto-201412033122 |
OEVS: | Sähköinen arkistokappale on luettavissa Aalto Thesis Databasen kautta.
Ohje Digitaalisten opinnäytteiden lukeminen Aalto-yliopiston Harald Herlin -oppimiskeskuksen suljetussa verkossaOppimiskeskuksen suljetussa verkossa voi lukea sellaisia digitaalisia ja digitoituja opinnäytteitä, joille ei ole saatu julkaisulupaa avoimessa verkossa. Oppimiskeskuksen yhteystiedot ja aukioloajat: https://learningcentre.aalto.fi/fi/harald-herlin-oppimiskeskus/ Opinnäytteitä voi lukea Oppimiskeskuksen asiakaskoneilla, joita löytyy kaikista kerroksista.
Kirjautuminen asiakaskoneille
Opinnäytteen avaaminen
Opinnäytteen lukeminen
Opinnäytteen tulostus
|
Sijainti: | P1 Ark Aalto 2461 | Arkisto |
Avainsanat: | speech speaker recognition diarization |
Tiivistelmä (eng): | In this thesis we document the development of a system to perform Speaker Diarization, that is, automatically trying to identify who spoke when in a conversation or any other piece of speech with several speakers. The intended usage is to be able to provide this functionality for broadcast news, with data provided by the Finnish broadcasting company YLE under the Next Media programme, financed by TEKES, the Finnish Funding Agency for Technology and Innovation. Another goal is to produce a system compatible with existing Aalto University speech recognition software, in order to open the door to future improvements and research. The produced system, a newly implementation of established methods, with the parameters we determined were the best for our use case, obtains a performance that is very close to current stat-of-the-art systems, while still being compatible with the existing speech recognition software of the Aalto University and having a reasonable speed performance. Further improvements to the system are being made as we speech, opening the door to more research options. |
ED: | 2014-12-21 |
INSSI tietueen numero: 50207
+ lisää koriin
« edellinen | seuraava »
INSSI