Fully-automated tongue detection in ultrasound images

Statistiques de téléchargement

Téléchargements

Téléchargements par mois depuis la dernière année

Karimi, Elham (2018). Fully-automated tongue detection in ultrasound images. Mémoire de maîtrise électronique, Montréal, École de technologie supérieure.

Prévisualisation	PDF Télécharger (3MB) \| Prévisualisation
Prévisualisation	PDF Télécharger (1MB) \| Prévisualisation

Résumé

Tracking the tongue in ultrasound images provides information about its shape and kinematics during speech. In this thesis, we propose engineering solutions to better exploit the existing frameworks and deploy them to convert a semi-automatic tongue contour tracking system to a fully-automatic one. Current methods for detecting/tracking the tongue require manual initialization or training using large amounts of labeled images.

This work introduces a new method for extracting tongue contours in ultrasound images that requires no training nor manual intervention. The method consists in: (1) application of a phase symmetry filter to highlight regions possibly containing the tongue contour; (2) adaptive thresholding and rank ordering of grayscale intensities to select regions that include or are near the tongue contour; (3) skeletonization of these regions to extract a curve close to the tongue contour and (4) initialization of an accurate active contour from this curve. Two novel quality measures were also developed that predict the reliability of the method so that optimal frames can be chosen to confidently initialize fully automated tongue tracking. This is achieved by automatically generating and choosing a set of points that can replace the manually segmented points for a semi-automated tracking approach. To improve the accuracy of tracking, this work also incorporates two criteria to re-set the tracking approach from time to time so the entire tracking result does not depend on human refinements.

Experiments were run on 16 free speech ultrasound recordings from healthy subjects and subjects with articulatory impairments due to Steinert’s disease. Fully automated and semi automated methods result in mean sum of distances errors of 1.01mm±0.57mm and 1.05mm± 0.63mm, respectively, showing that the proposed automatic initialization does not significantly alter accuracy. Moreover, the experiments show that the accuracy would improve with the proposed re-initialization (mean sum of distances error of 0.63mm±0.35mm).

Titre traduit

Détection entièrement automatisée de la langue dans les images ultrasonores

Résumé traduit

Le suivi de la langue dans les images échographiques fournit des informations sur sa forme et sa cinématique pendant la parole. Dans ce mémoire, nous proposons des solutions d’ingénierie pour mieux exploiter les cadres existants et les déployer afin de convertir un système de suivi semi-automatique du contour de la langue en un système entièrement automatique. Les methods actuelles de détection / suivi de la langue nécessitent une initialisation manuelle ou un entraînement utilisant de grandes quantités d’images étiquetées.

Ce mémoire présente une nouvelle méthode d’extraction des contours de la langue dans les images échographiques, qui ne nécessite aucun entraînement ni intervention manuelle. Le procédé consiste à: (1) appliquer un filtre de symétrie de phase pour mettre en évidence des régions contenant éventuellement le contour de la langue; (2) appliquer un seuillage adaptatif et classer les niveaux de gris pour sélectionner des régions qui incluent le contour de la langue ou se trouvent à proximité de ce dernier; (3) la squelettisation de ces régions pour extraire une courbe proche du contour de la langue et (4) l’initialisation d’un contour actif précis à partir de cette courbe. Deux nouvelles mesures de qualité ont également été développées pour prédire la fiabilité de la méthode, de sorte que des trames optimales puissent être choisies pour initializer en toute confiance un suivi de la langue entièrement automatisé. Ceci est réalisé en générant et en choisissant automatiquement un ensemble de points pouvant remplacer les points segmentés manuellement pour une approche de suivi semi-automatique. Pour améliorer la precision du suivi, ces travaux intègrent également deux critères permettant de réinitialiser l’approche de suivi de temps en temps, de sorte que le résultat de suivi ne dépende pas d’interventions humaines.

Les expériences ont été effectuées sur 16 enregistrements échographiques de parole libre de sujets sains et de sujets présentant des troubles articulatoires dus à la maladie de Steinert. Les méthodes entièrement automatisées et semi-automatisées mènent respectivement à une somme moyenne des erreurs de distance de 1.01mm±0.57mm et de 1.05mm±0.63mm, ce qui montre que l’initialisation automatique proposée ne modifie pas de manière significative l’exactitude. De plus, les expériences montrent que l’exactitude s’améliorerait avec la réinitialisation propose (somme moyenne des erreurs de distance de 0.63mm±0.35mm).

Type de document:	Mémoire ou thèse (Mémoire de maîtrise électronique)
Renseignements supplémentaires:	"Thesis presented to École de technologie supérieure in partial fulfillment of a master's degree with thesis in software engineering". Comprend des références bibliographiques (pages 69-73).
Mots-clés libres:	détection de la langue, segmentation d’image, ultrason, suivi entièrement automatisé
Directeur de mémoire/thèse:	Directeur de mémoire/thèse Laporte, Catherine
Codirecteur:	Codirecteur Ménard, Lucie
Programme:	Maîtrise en ingénierie > Génie
Date de dépôt:	08 mars 2019 15:58
Dernière modification:	08 mars 2019 15:58
URI:	https://espace.etsmtl.ca/id/eprint/2230

Gestion Actions (Identification requise)

Dernière vérification avant le dépôt