Brault, François (2018). Dépistage de pathologies par analyse de cris néonataux à l'aide de réseaux de neurones. Mémoire de maîtrise électronique, Montréal, École de technologie supérieure.
Prévisualisation |
PDF
Télécharger (4MB) | Prévisualisation |
Prévisualisation |
PDF
Télécharger (676kB) | Prévisualisation |
Résumé
Cette étude porte sur le dépistage automatisé de pathologies chez les nourrissons par analyse de leurs cris.
Dans le cadre de ce projet, nous avons tenté de réaliser cette tâche à l’aide de techniques de classification par réseaux de neurones artificiels, entraînés de façon supervisée.
Les enregistrements provenaient de la base de données de l’École de technologie supérieure. Seuls les cris de nourrissons nés à terme et âgés de 30 jours ou moins ont été considérés. Les segments expiratoires des cris furent séparés en échantillons de 400 millisecondes, puis ces échantillons furent subdivisés en 8 trames de 50 millisecondes. Chaque échantillon était représenté par les coefficients du cepstre de fréquences mel (MFCC) de ses trames.
Nous avons évalué trois architectures de réseaux de neurones différentes : Les perceptrons multicouches (MLP), les réseaux convolutionnels (CNN) et les réseaux récurrents de type long short-term memory (LSTM). Nous avons entraîné ces réseaux à reconnaître diverses pathologies, notamment l’hyperbilirubinémie et la détresse respiratoire. La performance des classifieurs était mesurée à l’aide de la validation croisée à k folds.
Nous avons aussi reproduit, autant que possible, le dataset employé dans une autre étude, afin de permettre un comparaison équitable. Nous avons entraîné et évalué notre système sur ce dataset. La comparaison des performances obtenues avec celles rapportées par l’étude de référence nous mène à conclure que notre approche a du potentiel, mais demeure pour l’instant inférieure à la leur.
Pour finir, nous avons également démontré qu’une partition inadéquate des données entre les ensembles d’entraînement et de validation pouvait produire une sous-estimation très importante de l’erreur de généralisation réelle. Nous avons soulevé des soupçons par rapport à la façon don't les données furent partitionnées dans plusieurs autres études sur la reconnaissance automatisée de pathologies chez les nourrissons par analyse de leurs cris.
Titre traduit
Pathology screening through newborn cry analysis using neural networks
Résumé traduit
This study focuses on the analysis of neonatal cry for the purpose of automated detection of pathologies.
In this projet, we tried to accomplish this task using supervised neural network classification techniques.
The recordings came from the École de technologie supérieure database. Only the cries of full-term infants aged 30 days or less were considered. The expiratory segments of the cries were separated into samples of 400 milliseconds, which were then subdivided further into 8 frames of 50 milliseconds. Each sample was then represented by the mel frequency cepstral coefficients (MFCC) of its frames.
We evaluated three different neural network architectures : multilayer perceptrons (MLP), convolutional neural networks (CNN) and long short-term memory recurrent neural networks (LSTM). We trained these networks to recognize various pathologies, most notably hyperbilirubinemia and respiratory distress. k fold cross-validation was used to evaluate classifier performance.
We also reproduced, as closely as possible, the dataset used in another study, in order to perform a fair comparison. We trained and evaluated our system on this dataset. The comparison of the performances we obtained with those reported by the reference study leads us to conclude that our approach has potential, but remains for the moment inferior to theirs.
Finally, we also demonstrated that inadequate data partitioning between training and validation sets could produce a very large underestimation of the true generalization error. We raised suspicions about how the data were partitioned into several other studies on automated recognition of pathologies by analysis of newborn cries.
Type de document: | Mémoire ou thèse (Mémoire de maîtrise électronique) |
---|---|
Renseignements supplémentaires: | "Mémoire présenté à l'École de technologie supérieure comme exigence partielle à l'obtention de la maîtrise avec mémoire en génie électrique" Comprend des références bibliographiques (pages 131-140). |
Mots-clés libres: | analyse du cri néonatal, dépistage de pathologies, perceptrons multicouches, réseaux convolutionnels, réseaux récurrents |
Directeur de mémoire/thèse: | Directeur de mémoire/thèse Tadj, Chakib |
Codirecteur: | Codirecteur Gargour, Christian |
Programme: | Maîtrise en ingénierie > Génie électrique |
Date de dépôt: | 08 mars 2019 16:54 |
Dernière modification: | 08 mars 2019 16:54 |
URI: | https://espace.etsmtl.ca/id/eprint/2223 |
Gestion Actions (Identification requise)
Dernière vérification avant le dépôt |