Speech bandwidth extension and vocal effort coding for enhanced communication in noisy industrial environments

Statistiques de téléchargement

Téléchargements

Téléchargements par mois depuis la dernière année

Bouserhal, Rachel E. (2016). Speech bandwidth extension and vocal effort coding for enhanced communication in noisy industrial environments. Thèse de doctorat électronique, Montréal, École de technologie supérieure.

Prévisualisation	PDF Télécharger (4MB) \| Prévisualisation
Prévisualisation	PDF Télécharger (2MB) \| Prévisualisation

Résumé

Communicating in noise is a difficult task for people wearing Hearing Protection Devices (HPD) in noisy industrial environments. In fact, the number one reason why workers choose not to wear HPDs in the workplace is that HPDs are a barrier to communication. Often, workers have to choose between protecting their hearing or communicating efficiently. The work done in this doctoral study aims at providing workers with good hearing protection and communication simultaneously without hindering the effectiveness of one for the other. The best option currently on the market is level dependent HPDs equipped with a boom microphone and radio capabilities. However, the weaknesses with such devices are two fold: the captured speech signal is degraded by the background noise and the radio does not distinguish intended listeners: all information is transmitted to everyone on the same radio channel. Therefore, the objectives of this work is to provide a high quality communication signal transmitted to an "intended" set of listeners within a specific spatial range; this range is defined by the talker’s vocal effort and the background noise level.

An intra-aural HPD containing an in-ear microphone, a miniature loudspeaker, and an outer-ear microphone, with wireless radio capabilities and a link to a digital signal processor is used to achieve this task. Since it is intra-aural, when worn correctly, this HPD can provide a good passive protection from the noise. Also, when it is worn correctly, it creates an acoustical seal in the ear canal causing the phenomenon known as the occlusion effect. This occlusion effect causes an amplification of bone conduction sounds to the occluded ear, thus allowing for a speech signal to be captured under the earplug using the in-ear microphone. Since it is captured after the passive attenuation of the HPD, this speech signal has a relatively high signal-to-noise ratio. However, originating from bone and tissue conduction it has a limited frequency bandwidth. In this work, the speech signal captured with the in-ear microphones is enhanced by removing any residual noise and by artificially extending its frequency bandwidth. A normalized least mean squares adaptive filter, with a voice activity detection algorithm is used to denoise the signal, while the nonlinear effects of cubing the excitation signal are exploited to extend the bandwidth of the in-ear microphone speech. In this work, the enhancement algorithm is validated both subjectively and objectively.

To mimic a natural acoustical environment by transmitting communication only to a set of intended listeners, the talker-to-listener distance is modeled as a function of the background noise level and variations in vocal effort. A direct relationship between these three factors is found after an experiment with 12 participants. Changes in speech levels and fundamental frequency as a function of noise and talker-to-listener distance for talkers wearing HPDs is determined. This knowledge paves the way for a radio acoustical environment, where a natural acoustical environment is mimicked while wearing HPDs and speech is only transmitted to a set of intended listeners within a given spatial range.

The objectives of this work are met by providing a high quality speech signal only to an intended set of listeners. The contributions of this work include several peer-reviewed publications, conference proceedings, a provisional patent, as well as the development of functional earplug prototypes that could significantly enhance the communication experience of people wearing HPDs and thus increase the use of HPDs in noisy industrial environments and reduce the risk of noise induced hearing loss.

Titre traduit

Extension de la bande spectrale de la parole et codage de l’effort vocal pour l’amélioration de la communication dans les milieux industriels bruyants

Résumé traduit

La communication dans les milieux industriels bruyants est une tâche difficile pour des personnes portant des protecteurs auditifs. Une des raisons principales pour lesquelles les travailleurs préfèrent ne pas porter de protecteurs auditifs est pour pouvoir mieux communiquer dans leurs milieux de travail. En effet, les travailleurs doivent souvent choisir entre protéger leur audition et communiquer efficacement. Le travail fait dans cette étude doctorale vise à fournir simultanément aux travailleurs une bonne protection auditive et une bonne capacité de communication. La meilleure option actuellement disponible sur le marché est l’utilisation de protecteurs auditifs électroniques dont l’atténuation dépend du niveau du bruit, et qui permettent également, à l’aide d’un micro-tige ("boom mic"), la communication radio entre les utilisateurs. Cependant, de tels dispositifs souffrent de deux défauts majeurs : premièrement, le signal de parole capté par le micro-tige est dégradé par le bruit de fond, et deuxièmement, le système de communication radio ne fait aucune distinction entre les utilisateurs a l’écoute : l’information vocale est transmise à tous les utilisateurs sur le même canal radio, contribuant de façon parfois significative à la dose de bruit reçue par ces derniers. Par conséquent, les objectifs de ce travail de thèse sont de fournir un signal de communication vocale de haute qualité transmis uniquement à des utilisateurs situés à l’intérieur d’un rayon spatial défini; ce rayon est défini conjointement par l’effort vocal du locuteur et par le niveau sonore du bruit de fond ambiant.

Un protecteur auditif intra-auriculaire numérique, contenant un microphone placé a l’intérieur de l’oreille, un haut-parleur, un microphone externe, un système de communication radio sans-fil et un processeur numérique du signal a été utilisé. Une fois porté correctement, ce protecteur auditif intra-auriculaire peut fournir une bonne protection passive contre le bruit. En outre, quand il est porté correctement, il crée une étanchéité acoustique dans le conduit auditif et est a l’origine du phénomène connu sous le nom d’effet d’occlusion. Cet effet d’occlusion cause une amplification des sons transmis par conduction osseuse à l’intérieur de l’oreille, permettant à un signal de parole d’être capté sous le protecteur auditif en utilisant le microphone interne. Puisqu’il est capté sous le protecteur auditif, ce signal de parole a un rapport signal/bruit relativement élevé. Cependant, parce qu’il provient de la conduction à travers les os, cartilages et tissus mous, ce signal de parole a une bande passante fréquentielle limitée. Dans ce travail, le signal de parole capté avec le microphone interne est amélioré par l’élimination du bruit résiduel et son spectre est re-haussé en appliquant une extension artificielle en haute-fréquences. Un filtrage adaptatif (nlms) couplé à un algorithme de détection d’activité vocale est utilisé pour éliminer le bruit résiduel, tandis que les non-linéarités introduites par l’opération mathématique de mise au cube de l’amplitude du signal de parole sont mises à profit pour l’extension fréquentielle du signal de parole capté sous le protecteur. L’amélioration apportée par cet algorithme a été validée subjectivement et objectivement.

Dans le but d’imiter au mieux un environnement acoustique naturel en ne transmettant la communication radio qu’à un ensemble d’auditeurs situés à l’intérieur d’une certaine distance du locuteur, la relation liant la distance entre le locuteur et l’auditeur, le niveau du bruit de fond ambiant et les variations dans l’effort vocal a été modélisée. Une relation directe entre ces trois variables a été trouvée après une expérience sur une douzaine de participants. Les changements du niveau de la pression acoustique et de la fréquence fondamentale de la parole ont été déterminés en fonction du niveau de bruit ambiant et de la distance entre le locuteur, portant des protecteurs auditifs, et l’auditeur. Ces résultats montrent qu’il serait possible de développer un "environnement radio-acoustique virtuel", dans lequel un environnement acoustique normal dans lequel le signal de parole, capté sur un locuteur portant des protecteurs auditifs, est transmis à un ensemble d’auditeurs situés a l’intérieur d’un certain rayon spatial.

Les objectifs de ce travail ont été atteints en développant des algorithmes permettant d’améliorer la qualité du signal de parole capté sous un protecteur auditif et permettant d’estimer le rayon spatial a l’intérieur duquel les auditeurs doivent percevoir ce signal transmis via des radios personnelles. Ces développements ont donné lieu à plusieurs publications dans des revues scientifiques à comité de lecture, plusieurs présentations dans des conférences arbitrées, au dépôt d’un brevet provisoire ainsi qu’au développement de prototypes fonctionnels de protecteurs susceptibles de grandement améliorer l’expérience de communication des personnes utilisant des protecteurs auditifs dans les milieux industriels bruyants et d’augmenter ainsi l’usage de tels protecteurs afin de remédier au fléau de la surdité professionnelle.

Type de document:	Mémoire ou thèse (Thèse de doctorat électronique)
Mots-clés libres:	traitement de la parole, communication dans le bruit, amélioration de la parole, effort vocal, protection auditive, filtrage adaptatif, extension de bande de fréquences
Directeur de mémoire/thèse:	Directeur de mémoire/thèse Voix, Jérémie
Codirecteur:	Codirecteur Falk, Tiago H.
Programme:	Doctorat en génie > Génie
Date de dépôt:	28 janv. 2021 14:38
Dernière modification:	28 janv. 2021 14:38
URI:	https://espace.etsmtl.ca/id/eprint/1681

Gestion Actions (Identification requise)

Dernière vérification avant le dépôt