Craciun, Alexandru (2004). Implémentation d'une méthode robuste de détection d'activité vocale sur le processeur de signal TMS320C6711. Mémoire de maîtrise électronique, Montréal, École de technologie supérieure.
Prévisualisation |
PDF
Télécharger (4MB) | Prévisualisation |
Résumé
Un algorithme de détection d'activité vocale (VAD) est un algorithme capable de discriminer entre les régions où la parole est absente dans le signal vocal analysé.
Le VAD est un module important utilisé dans une large gamme d'applications dans le domaine du traitement de la parole comme la reconnaissance, la transmission ou le rehaussement de la parole.
La nature non-stationnaire ainsi que la grande variété de signaux vocaux et de bruits de fond dans les conditions où on n'a pas d'informations a priori sur la nature ou le niveau du bruit rendent ce problème difficile spécialement dans le cas d'un faible rapport signal bruit RSB.
Bien que le problème de détection d'activité vocale ait été étudié depuis plusieurs décennies, une solution optimale ne s'est pas encore imposée. De nombreux algorithmes qui utilisent une large gamme de paramètres, certains d'entre-eux présentés dans cet ouvrage, ont été proposés pour répondre aux problèmes pratiques rencontrés.
Dans cet ouvrage on a implémenté sur le processeur numérique de signal TMS320C7611 un nouvel algorithme robuste de VAD qui utilise le concept d'analyse court-terme. La décision pour chaque trame de signal est fournie en temps-réel. Les distorsions spectrales, par rapport au spectre du bruit de fond, sont assimilées à des régions de parole et sont évaluées à l'aide de deux paramètres: le coefficient de corrélation spectrale et la moyenne de RSB de sous-bandes. Le filtrage médian et une approche statistique originale sont utilisés pour la détection robuste des régions de parole.
Pour évaluer les performances de l'algorithme proposé, on a utilisé un signal vocal de test complexe qui présente plusieurs régions de parole et de silence, corrompu avec plusieurs types de bruits réels dans le cas de trois RSB différentes. Les résultats de tests montrent le comportement robuste de l'algorithme proposé.
Titre traduit
Implementation of a new robust voice activity detection algorithm on the TMS320C6711 DSP
Résumé traduit
A voice activity detector (VAD) is an algorithm able to distinguish the speech regions from the background noise of the input signal and it is an important step in many speech-processing applications. The problem of end point detection has been studied for several decades but despite this fact it remains an open field of research. Various types of VAD algorithms have been proposed and currently most of them use one or more parameters to met practical requirement. In this work we propose a new VAD algorithm designed to improve the solution of word boundary detection problem for variable background noise level in a real time application. This algorithm is based on the short-time analysis and uses two parameters: the correlation coefficient between the instantaneous spectrum and an average of the background noise spectrum, and the average of the subband signal to noise ratio. The speech regions may be detected based on a median filtering and a statistical approach. To evaluate the performance of the proposed method a clean speech dataset from the TIMIT database corrupted with different types of noise from NOISEX database for different SNR levels has been utilized.
The algorithm was then implemented and tested on the TMS320C6711 floating-point DSP of Texas Instruments. The tools used to develop this application are the Code Composer Studio, which provide an integrated development environment and the DSP starter kit (DSK) with the TMS320C6711 processor on board and complete support for input and output.
The new proposed algorithm is proved to be robust and flexible. The structure of the algorithm allows adjustments to make it more efficient for some specified condition.
Type de document: | Mémoire ou thèse (Mémoire de maîtrise électronique) |
---|---|
Renseignements supplémentaires: | "Mémoire présenté à l'École de technologie supérieure comme exigence partielle à l'obtention de la maîtrise en génie électrique". Bibliogr.: f. [164]-167. |
Mots-clés libres: | Activite, Algorithme, Analyse, Detection, Implementation, Methode, Numerique, Parole, Processeur, Robuste, Signal, Spectral, TMS320C6711 |
Directeur de mémoire/thèse: | Directeur de mémoire/thèse Gabrea, Gheorghe Marcel |
Programme: | Maîtrise en ingénierie > Génie électrique |
Date de dépôt: | 20 avr. 2011 20:05 |
Dernière modification: | 21 oct. 2016 00:39 |
URI: | https://espace.etsmtl.ca/id/eprint/713 |
Gestion Actions (Identification requise)
Dernière vérification avant le dépôt |