Preiss, Rémi (2006). Étude du canal téléphonique dans un système de reconnaissance robuste de la parole. Mémoire de maîtrise électronique, Montréal, École de technologie supérieure.
Prévisualisation |
PDF
Télécharger (2MB) | Prévisualisation |
Résumé
Ils existent des techniques pour compenser l'effet du canal sur un système de reconnaissance que l'on peut regrouper en deux catégories, les techniques paramétriques et les techniques d'adaptation des modèles. Dans cette maîtrise, nous avons étudié plusieurs techniques d'adaptation des paramètres, et aussi proposé une méthode d'adaptation des modèles. Elle consiste à construire des modélisations de canaux téléphoniques pour créer une nouvelle base d'apprentissage multiréférences. Le système est alors appris avec la base de données TIMIT bruitée par ces modélisations, NTIMIT a servi pour la phase de test. Au final, cette méthode s'est révélée concluante car le taux d'erreurs a été réduit de manière significative.
Titre traduit
Study of the voice channel in robust speech recognition
Résumé traduit
The telephone channel triggers, by the reduction of the signal bandwidth, a drop of the performances of most of the recognition systems which belong to speaker identification or continuous speech recognition.
Many compensation techniques have been developed to reduce the unmatching issue between the training and the test databases which is supposed to be the main cause of the results decrease. We can gather these techniques in two categories: (1) feature compensation in which the representation of the acoustic vector is adjusted, and (2)odel adaptation in which the HMM parameters are modified to get closer of the testing environments.
In this master, we evaluated several feature compensation techniques and we also developed a model adaptation method. The main idea is to develop a modeling of the PSTN channel. Then, we trained HMM with the TIMIT database passed through different PSTN channel modeling in order to get a new multireferences training database adapted to the convolutive effect of the reduction bandwidth. The NTIMIT database has been used for testing. Finally, the word error rate has been significantly decreased.
Type de document: | Mémoire ou thèse (Mémoire de maîtrise électronique) |
---|---|
Renseignements supplémentaires: | "Mémoire présenté à l'École de technologie supérieure comme exigence partielle à l'obtention de la maîtrise en génie électrique". Bibliogr.: f. [89]-93. |
Mots-clés libres: | Canal, HTK, Parole, Reconnaissance, Robuste, Systeme, Telephone |
Directeur de mémoire/thèse: | Directeur de mémoire/thèse Gabrea, Gheorghe Marcel |
Programme: | Maîtrise en ingénierie > Génie électrique |
Date de dépôt: | 22 mars 2011 15:31 |
Dernière modification: | 04 nov. 2016 01:33 |
URI: | https://espace.etsmtl.ca/id/eprint/469 |
Actions (Identification requise)
![]() |
Dernière vérification avant le dépôt |