La vitrine de diffusion des mémoires et thèses de l'ÉTS
RECHERCHER

Étude de quelques méthodes de détection d'activité vocale dans des environnements industriels bruités

Séris, Julie (2006). Étude de quelques méthodes de détection d'activité vocale dans des environnements industriels bruités. Mémoire de maîtrise électronique, Montréal, École de technologie supérieure.

[img]
Prévisualisation
PDF
Télécharger (5MB) | Prévisualisation

Résumé

Le travail proposé est la mise au point d'un détecteur d'activité vocale (DAV) performant pour une utilisation dans des milieux industriels bruités. Pour cela, deux approches ont été abordées. La première a consisté à modifier un DAV existant afin de l'adapter à ce type d'environnement, la plupart de ceux proposés dans la littérature ayant été développés pour les télécommunications. Le DAV du codeur de parole G729 a donc été adapté aux milieux industriels. Les performances obtenues sont intéressantes. La deuxième approche, elle, est basée sur la théorie des ondelettes. Nos recherches nous ont permis d'aboutir à un nouvel algorithme: le DAV INNES. Il repose sur deux notions fondamentales: la décomposition en paquets d'ondelettes selon l'échelle de Mel et la prise de décision en fonction des valeurs du Paramètre du Seuil de Johnstone et Silverman et des énergies. Les résultats obtenus sont très satisfaisants.

Titre traduit

Study of some methods of voice activity detection in noisy industrial environments

Résumé traduit

The work suggested here is the development of an effective algorithm of voice activity detection for use in noisy industrial backgrounds. For that, two approaches were used. The first one consisted in modifying an existing voice activity detector (VAD) so that it is adapted to this kind of environment. The majority of the methods which are proposed in the literature were developed for telecommunications. We studied some of them. By examining the complexity of their algorithm as well as their advantages and disadvantages, we retained one of them, namely that used in the speech coder G729. Then, we adapted it to industrial backgrounds. The performances of the system thus adjusted are satisfactory. The second approach is based on the wavelets theory. Our research enabled us to develop a novel algorithm of voice activity detection that we named VAD INNES. It rests on two fundamental concepts: the decomposition in wavelet packets in accordance with the Mel scale and the decision-making according to the values of the parameter of the threshold of Johnstone and Silverman and of the energies. An automatic and fast procedure of adjustment was developed in order to determine for each industrial background the best rules of decision and to have thus increased performances. The obtained results are very satisfactory.

Type de document: Mémoire ou thèse (Mémoire de maîtrise électronique)
Renseignements supplémentaires: "Mémoire présenté à l'École de technologie supérieure comme exigence partielle à l'obtention de la maîtrise en génie électrique". Bibliogr.: f. [195]-200.
Mots-clés libres: Activite, Bruit, Detecteur, Detection, G729.B, Industrie, Methode, Ondelette, Parole, Vocal, Voix
Directeur de mémoire/thèse:
Directeur de thèse
Gargour, Christian
Co-directeurs de mémoire/thèse:
Co-directeurs de thèse
Laville, Frédéric
Programme: Maîtrise en ingénierie > Génie électrique
Date de dépôt: 24 mars 2011 17:33
Dernière modification: 04 nov. 2016 21:18
URI: http://espace.etsmtl.ca/id/eprint/471

Actions (Identification requise)

Dernière vérification avant le dépôt Dernière vérification avant le dépôt

Statistique

Plus de statistique...