Classification d’images IRM cérébrales fondée sur un mécanisme d’attention invariant à l’échelle

Statistiques de téléchargement

Téléchargements

Téléchargements par mois depuis la dernière année

Vázquez Romaguera, Talía (2025). Classification d’images IRM cérébrales fondée sur un mécanisme d’attention invariant à l’échelle. Mémoire de maîtrise électronique, Montréal, École de technologie supérieure.

[thumbnail of VAZQUEZ_ROMAGUERA_Talia.pdf]

Prévisualisation

PDF
Télécharger (11MB) | Prévisualisation

Résumé

Ce mémoire aborde la classification fine des IRM structurelles du cerveau tout en préservant leur interprétabilité anatomique. Quatre familles de modèles complémentaires sont comparées : (1) un pipeline hiérarchique SIFT–MLP qui classe les points clés 3D et agrège les votes au niveau du sujet; (2) des CNN 3D entraînés de bout en bout sur des volumes d’IRM pondérées en T1; (3) un CNN peu profond exploitant des cartes de descripteurs SIFT 3D; et (4) un modèle hybride 3D-SIFT–Attention qui combine la morphologie locale invariante d’échelle et le contexte global au moyen d’une attention croisée. De plus, nous proposons une méthode d’Integrated-Gradients–Guided Keypoint Attribution (IG-KPA), qui aligne les attributions sur les points clés SIFT afin d’améliorer l’explicabilité. Le modèle hybride améliore la précision de classification dans tous les cas, par rapport aux réseaux standards ou aux points clés seuls, sur les jeux de données ADNI, HCP et OASIS, et pour les tâches de classification du sexe, de la maladie d’Alzheimer et de l’âge. Une exactitude de 94 % est obtenue pour la classification du sexe à partir de données rigidement recalées; toutefois, les différences de taille entre hommes et femmes constituent un facteur de confusion majeur. Après correction des effets de taille par recalage déformable, la précision est limitée à environ 92 %, en accord avec la littérature, ce qui suggère que l’IRM d’environ 8 % des individus ressemble davantage à celle du sexe opposé. Les analyses d’interprétabilité localisent systématiquement les signaux dans des régions neuro anatomiquement plausibles : les territoires thalamo-capsulaires profonds et périventriculaires pour la classification du sexe, et principalement des signatures ventriculaires pour l’âge et la maladie d’Alzheimer. En général, les résultats mettent en évidence l’intérêt des mécanismes d’attention qui intègrent des indices locaux invariants d’échelle avec un contexte spatial global pour les tâches de classification fine d’images cérébrales.

Titre traduit

Brain MRI classification using a scale-invariant keypoint attention mechanism

Résumé traduit

This thesis addresses the fine-grained classification of structural brain MRI while maintaining anatomical interpretability. We compare four complementary model families : (1) a hierarchical SIFT–MLP pipeline that classifies 3D keypoints and aggregates subject-level votes; (2) end-to end 3D CNNs trained on native T1-weighted MRI volumes; (3) a shallow CNN operating on 3D SIFT descriptor maps; and (4) a hybrid 3D-SIFT–Attention model that fuses scale-invariant local morphology with global context via cross-attention. Furthermore, we propose an Integrated Gradients–Guided Keypoint Attribution (IG-KPA) method, which aligns attributions with SIFT keypoints to enhance explainability. Our hybrid model improves classification accuracy in all cases, compared to standard networks or keypoints alone, for ADNI, HCP, OASIS datasets and sex, Alzheimer’s and age classification. State-of-the-art sex classification accuracy of 94% is obtained from rigidly aligned data, however size differences between males and females is a significant confound. After removing size differences via deformable registration, sex classification accuracy appears limited to 92%, consistent with other work, indicating that the brain MRIs of 8% of people appear more similar to those of the opposite sex. Moreover, interpretability analyses consistently localize signal to neuroanatomically plausible regions, with bilateral deep thalamo-capsular and periventricular territories for sex classification, and predominantly ventricular signatures for age and Alzheimer’s disease. Overall, the results underscore the advantage of attention mechanisms that merge stable, scale-invariant local cues with broader spatial context in fine-grained brain image classification tasks.

Type de document:	Mémoire ou thèse (Mémoire de maîtrise électronique)
Renseignements supplémentaires:	"Mémoire présenté à l’École de technologie supérieure comme exigence partielle à l'obtention de la maîtrise avec mémoire". Comprend des références bibliographiques (pages 69-76).
Mots-clés libres:	IRM cérébrale, caractéristiques invariantes d’échelle (SIFT), mécanisme d’attention croisée, interprétabilité
Directeur de mémoire/thèse:	Directeur de mémoire/thèse Toews, Matthew
Programme:	Maîtrise en ingénierie > Génie de la production automatisée
Date de dépôt:	24 févr. 2026 18:06
Dernière modification:	24 févr. 2026 18:06
URI:	https://espace.etsmtl.ca/id/eprint/3784

Gestion Actions (Identification requise)

Dernière vérification avant le dépôt