La vitrine de diffusion des mémoires et thèses de l'ÉTS
RECHERCHER

Utilisation de la transformée de Fourier et de la transformée en ondelettes pour la reconnaissance du locuteur

Badri, Nabil (2002). Utilisation de la transformée de Fourier et de la transformée en ondelettes pour la reconnaissance du locuteur. Mémoire de maîtrise électronique, Montréal, École de technologie supérieure.

[img]
Prévisualisation
PDF
Télécharger (2MB) | Prévisualisation

Résumé

Ce travail porte sur l'utilisation de la transformée en ondelettes pour la vérification du locuteur en mode de texte dépendant. Nous avons étudié deux approches dans le cadre de ce sujet: (a) La première est basée sur l'utilisation de la méthode MFDWC (Mel Frequency Discrete Wavelet Coefficients) faisant usage des filtres de Daubechies d'ordres fixe, et d'ordres adaptés au sens de certains critères d'entropies. (b) La deuxième approche est basée sur l'utilisation de l'algorithme de sélection de la meilleure base d'ondelettes au sens du critère d'entropie de Shannon non normalisé. Nous avons proposé dans le cadre de cette approche un algorithme de construction du meilleur arbre du locuteur. Nous avons nommé cet algorithme MAL (Meilleur arbre du locuteur). Cette méthode permet de construire une librairie d'arbres admissibles à partir des phrases d'entraînement. Chaque arbre admissible correspond à un locuteur. Nous avons testé les performances de reconnaissance en effectuant des expériences sur (60) locuteurs. Ces derniers sont extraits de la base de données de Yoho. Finalement, les résultats des deux méthodes ont été comparés avec ceux de la méthode MFCC (Mel Frequency Cepstral Coefficient).

Résumé anglais

In this work, we study the use of the Wavelet Transform in text-dependent speaker verification mode. An experimental framework has been conducted using two approaches: (a) The use of MFDWC (Mel Frequency Discrete Wavelet Coefficients with Daubechies wavelet filters of fixed and adapted orders. These adapted orders have been determined according to several criteria. (b) We have used the best basis wavelet selection algorithm according to the non-normalized Shannon entropy criterion. We have named the proposed algorithm MAL (Meilleur Arbre du Locuteur). We have then used it to build a speaker dependent library tree, corresponding to the best structure for given speakers. Experiments have been conducted using 60 speakers, extracted from the Yoho Database and using a phone-based HMM speaker verification system. Finally, the results of the two approaches have been compared with those given by the MFCC method.

Type de document: Mémoire ou thèse (Mémoire de maîtrise électronique)
Renseignements supplémentaires: "Mémoire présenté à l'École de technologie supérieure comme exigence partielle à l'obtention de la maîtrise en technologie des systèmes". Bibliogr.: f. [95]-96.
Mots-clés libres: Fourrier, Locuteur, Ondelette, Reconnaissance, Transformee, Verification
Directeur de mémoire/thèse:
Directeur de mémoire/thèse
Tadj, Chakib
Co-directeurs de mémoire/thèse:
Co-directeurs de mémoire/thèse
Gargour, Christian
Programme: Maîtrise en ingénierie > Technologie des systèmes
Date de dépôt: 11 mai 2011 17:43
Dernière modification: 13 oct. 2016 20:39
URI: http://espace.etsmtl.ca/id/eprint/792

Actions (Identification requise)

Dernière vérification avant le dépôt Dernière vérification avant le dépôt

Statistique

Plus de statistique...