Annotation-efficient and reliable medical image segmentation

Statistiques de téléchargement

Téléchargements

Téléchargements par mois depuis la dernière année

Gaillochet, Mélanie (2026). Annotation-efficient and reliable medical image segmentation. Thèse de doctorat électronique, Montréal, École de technologie supérieure.

Prévisualisation

PDF
Télécharger (11MB) | Prévisualisation

Résumé

Medical image segmentation, which automatically delineates anatomical structures or lesions, is a key step for diagnosis, surgical planning, and disease monitoring. While deep learning based algorithms have delivered state-of-the-art segmentation performance, their integration into the clinical workflow is hindered by two major challenges: the high cost of acquiring large annotated datasets and the lack of guarantees on model reliability.

The objective of this thesis is to develop more reliable and annotation-efficient segmentation algorithms in order to facilitate their clinical adoption. In particular, we address each limitation by targeting a distinct stage of the model development life-cycle. First, we propose a stochastic batch active learning framework that computes uncertainty at the batch level to strategically select, before training, the most informative samples to annotate from large unlabeled datasets. By implicitly enforcing diversity in the selection without additional computational cost, our strategy achieves better segmentation performance than purely uncertainty-based and random sampling, given a fixed data sampling budget. Second, we introduce a weakly-supervised prompt learning framework that adapts large promptable vision foundation models to medical tasks using only bounding box annotations. By applying box-based spatial constraints and consistency regularization to compensate for the reduced label information, our approach avoids costly pixel-level supervision during training and enables resource-efficient segmentation. Results show that weakly-supervised prompt learning is a scalable alternative to fully-supervised specialization of both foundation and non-foundation models. Third, we develop an anatomically-aware conformal prediction framework to provide statistical guarantees on the segmentation outputs after deployment. Specifically, we draw on the dense feature representations of vision foundation models to integrate anatomical context into the conformal process and construct geometrically consistent and statistically valid prediction sets. Our framework can be appended to any trained segmentation model without retraining, making it broadly applicable across architectures and clinical tasks.

Evaluated across multiple medical imaging modalities and anatomical targets, these contributions bring medical image segmentation closer to clinical deployment by reducing the annotation burden and providing reliability guarantees.

Titre traduit

Segmentation médicale fiable et peu coûteuse en annotations

Résumé traduit

La segmentation d’images médicales, délimitation précise des structures anatomiques ou des lésions, est une étape clef pour le diagnostic médical, la planification chirurgicale et le suivi des pathologies. Les algorithmes d’apprentissage profond ont permis d’atteindre de hautes performances en segmentation automatique. Cependant, leur intégration en milieu clinique reste contrainte par deux obstacles majeurs : le coût prohibitif de l’annotation manuelle des données et l’absence de garanties statistiques sur les prédictions des modèles.

L’objectif de cette thèse est de développer des algorithmes de segmentation plus fiables et moins coûteux en annotations afin de faciliter leur adoption clinique. En particulier, nous abordons chaque obstacle à leur déploiement en ciblant des étapes distinctes du cycle de développement des modèles. Premièrement, nous proposons une méthode d’apprentissage actif basée sur des lots stochastiques pour sélectionner stratégiquement, avant l’entraînement du modèle, les données les plus informatives pour annotation. Cela permet d’atteindre des performances de segmentation élevées avec une fraction du budget d’annotation traditionnel. Deuxièmement, nous utilisons uniquement, durant l’entraînement, des annotations sous forme de boîtes englobantes, moins coûteuses à obtenir, pour spécialiser et automatiser les modèles de fondation visuels. Nous introduisons une stratégie d’apprentissage de prompts faiblement supervisée basée sur des contraintes et sur la régularisation. Troisièmement, nous développons un cadre de prédiction conforme anatomiquement cohérent pour fournir des garanties statistiques sur les masques de segmentation prédits après déploiement. Grâce à l’intégration au processus conforme d’une étape de diffusion par marche aléatoire basée sur les représentations des modèles de fondation, les ensembles de prédiction générés deviennent à la fois géométriquement cohérents et statistiquement valides.

Évaluées sur plusieurs modalités d’imagerie médicale et tissus anatomiques, ces contributions ouvrent la voie à une segmentation d’images médicales à la fois plus sûre et moins coûteuse en annotations, pour un meilleur déploiement clinique.

Type de document:	Mémoire ou thèse (Thèse de doctorat électronique)
Renseignements supplémentaires:	"Manuscript-based thesis presented to École de technologie supérieure in partial fulfillment for the degree of Doctor of Philosophy". Comprend des références bibliographiques (pages 137-154).
Mots-clés libres:	analyse d’images médicales, annotation, apprentissage actif, apprentissage faiblement supervisé, boîte englobante, contraintes, incertitude, modèle fondateur, prédiction conforme, segmentation
Directeur de mémoire/thèse:	Directeur(-trice) Lombaert, Hervé
Codirecteur:	Codirecteur(-trice) de mémoire/thèse Desrosiers, Christian
Programme:	Doctorat en génie > Génie
Date de dépôt:	11 juin 2026 14:29
Dernière modification:	11 juin 2026 14:29
URI:	https://espace.etsmtl.ca/id/eprint/3938

Gestion Actions (Identification requise)

Dernière vérification avant le dépôt