La vitrine de diffusion des mémoires et thèses de l'ÉTS
RECHERCHER

Étude du canal téléphonique dans un système de reconnaissance robuste de la parole

Preiss, Rémi (2006). Étude du canal téléphonique dans un système de reconnaissance robuste de la parole. Mémoire de maîtrise électronique, Montréal, École de technologie supérieure.

[img]
Prévisualisation
PDF
Télécharger (2MB) | Prévisualisation

Résumé

Ils existent des techniques pour compenser l'effet du canal sur un système de reconnaissance que l'on peut regrouper en deux catégories, les techniques paramétriques et les techniques d'adaptation des modèles. Dans cette maîtrise, nous avons étudié plusieurs techniques d'adaptation des paramètres, et aussi proposé une méthode d'adaptation des modèles. Elle consiste à construire des modélisations de canaux téléphoniques pour créer une nouvelle base d'apprentissage multiréférences. Le système est alors appris avec la base de données TIMIT bruitée par ces modélisations, NTIMIT a servi pour la phase de test. Au final, cette méthode s'est révélée concluante car le taux d'erreurs a été réduit de manière significative.

Titre traduit

Study of the voice channel in robust speech recognition

Résumé traduit

The telephone channel triggers, by the reduction of the signal bandwidth, a drop of the performances of most of the recognition systems which belong to speaker identification or continuous speech recognition.

Many compensation techniques have been developed to reduce the unmatching issue between the training and the test databases which is supposed to be the main cause of the results decrease. We can gather these techniques in two categories: (1) feature compensation in which the representation of the acoustic vector is adjusted, and (2)odel adaptation in which the HMM parameters are modified to get closer of the testing environments.

In this master, we evaluated several feature compensation techniques and we also developed a model adaptation method. The main idea is to develop a modeling of the PSTN channel. Then, we trained HMM with the TIMIT database passed through different PSTN channel modeling in order to get a new multireferences training database adapted to the convolutive effect of the reduction bandwidth. The NTIMIT database has been used for testing. Finally, the word error rate has been significantly decreased.

Type de document: Mémoire ou thèse (Mémoire de maîtrise électronique)
Renseignements supplémentaires: "Mémoire présenté à l'École de technologie supérieure comme exigence partielle à l'obtention de la maîtrise en génie électrique". Bibliogr.: f. [89]-93.
Mots-clés libres: Canal, HTK, Parole, Reconnaissance, Robuste, Systeme, Telephone
Directeur de mémoire/thèse:
Directeur de thèse
Gabrea, Gheorghe Marcel
Programme: Maîtrise en ingénierie > Génie électrique
Date de dépôt: 22 mars 2011 15:31
Dernière modification: 04 nov. 2016 01:33
URI: http://espace.etsmtl.ca/id/eprint/469

Actions (Identification requise)

Dernière vérification avant le dépôt Dernière vérification avant le dépôt

Statistique

Plus de statistique...