La vitrine de diffusion des mémoires et thèses de l'ÉTS
RECHERCHER

Conception d'une méthode robuste de reconnaissance de la parole pour un système embarqué

Charpentier, Christophe (2008). Conception d'une méthode robuste de reconnaissance de la parole pour un système embarqué. Mémoire de maîtrise électronique, Montréal, École de technologie supérieure.

[img]
Prévisualisation
PDF
Télécharger (53MB) | Prévisualisation
[img]
Prévisualisation
PDF
Télécharger (8MB) | Prévisualisation

Résumé

Malgré sa présence grandissante dans les applications de la vie quofidienne, la reconnaissance robuste de la parole reste un défi à relever lorsqu'il s'agit de l'appliquer à partir de systèmes aux ressources limitées, même pour un vocabulaire très simple (recomiaissance de chiffres connectés à travers un canal téléphonique). Plutôt que d'utiliser une approche traditionnelle fondée sur les modèles de Markov cachés, qui nécessite un calcul intensif, et qui ne fonctionne d'ailleurs pas toujours bien dans des conditions acoustiques défavorables, la méthode présentée dans ce document se base sur un modèle de construction globale, identique pour l'ensemble des chiffres du vocabulaire, pour réduire la complexité de la tâche de reconnaissance tout en maintenant un bon niveau d'efficacité. Après une phase de segmentation découpant le signal en une succession d'unités acoustiquement homogènes, un processus de reconstmction se charge d'insérer ces segments dans le modèle global, en se fondant sur certaines contraintes et propriétés propres au vocabulaire concerné, pour ariver à déterminer au final le candidat le plus susceptible de correspondre au mot inconnu. La reconnaissance de chiffres aussi bien isolés que connectés est alors peraiise avec un taux de réussite satisfaisant, au moyen d'une quantité de calculs très réduite, tout comme l'espace mémoire requis.

Résumé traduit

Despite its growing presence in many daily applications, robust speech recognition remains a challenge, when used on embedded Systems, even for a very simple vocabulary (recognition of connected digits through a telephone channel). Rather than using a traditional approach based on the hidden Markov Models, which requires intensive Computing, and does not always work well in adverse acoustical conditions, the method presented in this paper is based on an overall construction model, invariant for all the digits in the vocabulary, to reduce the complexity of the recognition task while maintaining a good level of efficiency. After a segmentation phase, during which the signal is cut in a succession of acoustically homogeneous units, a reconstruction process put these segments, using constraints and properties set by the structure of the vocabulary, to achieve the selection of the candidate that corresponds most likely to the unknown unit. The recognition of isolated digits, as well as connected, is permitted with a good success rate, using a very limited number of calculations, and a low amount of required memory.

Type de document: Mémoire ou thèse (Mémoire de maîtrise électronique)
Renseignements supplémentaires: "Mémoire présenté à l'École de technologie supérieure comme exigence partielle à l'obtention de la maîtrise en génie électrique." Bibliogr. : f. [159]-162.
Mots-clés libres: complexite, conception, construction, efficacite, embarque, global, methode, modele, numerique, parole, production, reconnaissance, robuste, signal, systeme, tache, traitement, vocal
Directeur de mémoire/thèse:
Directeur de thèse
Gabrea, Gheorghe Marcel
Programme: Maîtrise en ingénierie > Génie électrique
Date de dépôt: 09 août 2010 13:45
Dernière modification: 03 déc. 2016 00:22
URI: http://espace.etsmtl.ca/id/eprint/94

Actions (Identification requise)

Dernière vérification avant le dépôt Dernière vérification avant le dépôt

Statistique

Plus de statistique...