Séris, Julie (2006). Étude de quelques méthodes de détection d'activité vocale dans des environnements industriels bruités. Mémoire de maîtrise électronique, Montréal, École de technologie supérieure.
Prévisualisation |
PDF
Télécharger (5MB) | Prévisualisation |
Résumé
Le travail proposé est la mise au point d'un détecteur d'activité vocale (DAV) performant pour une utilisation dans des milieux industriels bruités. Pour cela, deux approches ont été abordées. La première a consisté à modifier un DAV existant afin de l'adapter à ce type d'environnement, la plupart de ceux proposés dans la littérature ayant été développés pour les télécommunications. Le DAV du codeur de parole G729 a donc été adapté aux milieux industriels. Les performances obtenues sont intéressantes. La deuxième approche, elle, est basée sur la théorie des ondelettes. Nos recherches nous ont permis d'aboutir à un nouvel algorithme: le DAV INNES. Il repose sur deux notions fondamentales: la décomposition en paquets d'ondelettes selon l'échelle de Mel et la prise de décision en fonction des valeurs du Paramètre du Seuil de Johnstone et Silverman et des énergies. Les résultats obtenus sont très satisfaisants.
Titre traduit
Study of some methods of voice activity detection in noisy industrial environments
Résumé traduit
The work suggested here is the development of an effective algorithm of voice activity detection for use in noisy industrial backgrounds. For that, two approaches were used. The first one consisted in modifying an existing voice activity detector (VAD) so that it is adapted to this kind of environment. The majority of the methods which are proposed in the literature were developed for telecommunications. We studied some of them. By examining the complexity of their algorithm as well as their advantages and disadvantages, we retained one of them, namely that used in the speech coder G729. Then, we adapted it to industrial backgrounds. The performances of the system thus adjusted are satisfactory. The second approach is based on the wavelets theory. Our research enabled us to develop a novel algorithm of voice activity detection that we named VAD INNES. It rests on two fundamental concepts: the decomposition in wavelet packets in accordance with the Mel scale and the decision-making according to the values of the parameter of the threshold of Johnstone and Silverman and of the energies. An automatic and fast procedure of adjustment was developed in order to determine for each industrial background the best rules of decision and to have thus increased performances. The obtained results are very satisfactory.
Type de document: | Mémoire ou thèse (Mémoire de maîtrise électronique) |
---|---|
Renseignements supplémentaires: | "Mémoire présenté à l'École de technologie supérieure comme exigence partielle à l'obtention de la maîtrise en génie électrique". Bibliogr.: f. [195]-200. |
Mots-clés libres: | Activite, Bruit, Detecteur, Detection, G729.B, Industrie, Methode, Ondelette, Parole, Vocal, Voix |
Directeur de mémoire/thèse: | Directeur de mémoire/thèse Gargour, Christian |
Codirecteur: | Codirecteur Laville, Frédéric |
Programme: | Maîtrise en ingénierie > Génie électrique |
Date de dépôt: | 24 mars 2011 17:33 |
Dernière modification: | 04 nov. 2016 21:18 |
URI: | https://espace.etsmtl.ca/id/eprint/471 |
Gestion Actions (Identification requise)
Dernière vérification avant le dépôt |