Rony, Jérôme (2020). Feed-forward weakly supervised deep learning models for breast cancer diagnosis from histological images. Mémoire de maîtrise électronique, Montréal, École de technologie supérieure.
Prévisualisation |
PDF
Télécharger (11MB) | Prévisualisation |
Prévisualisation |
PDF
Télécharger (1MB) | Prévisualisation |
Résumé
Breast cancer screening has become one of the top priorities to reduce the number of deaths from breast cancer and treat it as soon as possible. When making a diagnosis for breast cancer, the gold standard is histological image analysis. However, these images are very large and require both time and expertise to be correctly interpreted. Research in computer vision algorithms has shown great potential to assist practitioners in making faster and more accurate diagnoses. However, to use these kinds of algorithms, large amounts of data with high quality annotations are often required.
In this thesis, we propose to approach this problem from the perspective of weakly supervised learning. In this scenario, we consider that we only have weak annotations such as image-level labels for each sample. With these weak annotations, we seek to train accurate models to accurately predict both image-level (classification) and pixel-level labels (segmentation).
As a first contribution, we identify, analyze and evaluate several weakly supervised techniques proposed for natural images with the intent of identifying which one are the most promising for our application.
As a second contribution, we generalize a technique proposed for binary classification to the more general settings of multi-class and multi-label classification. We show that this technique scales well to widely used natural image datasets and further evaluate it on histological image datasets.
As a third contribution, we study the impact of adding size constraints to train a model. This corresponds to a scenario where an annotator would only estimate the size of the cancerous regions in histological images, reducing the time needed to annotate images when doing a segmentation. We propose a formulation to take advantage of the size information and show that it significantly improves the segmentation performance compared to training with image-level labels only.
Titre traduit
Modèles d’apprentissage profond faiblement supervisés pour le diagnostic du cancer du sein à partir d’images histologiques
Résumé traduit
Le dépistage du cancer du sein est devenu une priorité afin de réduire le nombre de décès causés par cette maladie et la traiter le plus tôt possible. Le meilleur moyen de confirmer un diagnostic du cancer du sein est l’analyse d’images histologiques. Cependant, l’analyse de ces images requiert du temps et une forte expertise pour produire un diagnostic correct. La recherche en algorithmes de vision par ordinateur a montré un fort potentiel pour assister les médecins afin d’effectuer des diagnostics rapides et précis. Toutefois, ce type d’algorithmes requiert un volume important de données avec des annotations de qualité.
Dans ce mémoire, nous proposons d’approcher ce problème par l’apprentissage faiblement supervisé. Dans ce scénario, seuls des annotations faibles tels que des étiquettes au niveau de l’image sont disponibles. Avec ces annotations faibles, nous souhaitons entraîner des modèles pouvant prédire avec précision les étiquettes d’images (classification) et de pixels (segmentation).
Comme première contribution, nous avons identifié, analysé et évalué plusieurs méthodes d’apprentissage faiblement supervisé originalement proposées pour des images naturelles afin d’identifier celles qui sont les plus prometteuses pour notre application.
Comme seconde contribution, nous avons généralisé une technique initialement proposée pour de la classification binaire pour les cas plus généraux de classification mutli-classes et multi-étiquettes. Nous avons montré que cette technique fonctionne sur des datasets d’images naturelles et ensuite évaluée sur des images histologiques.
Comme troisième contribution, nous avons étudié l’impact d’ajouter des contraintes de tailles pour l’entraînement des modèles. Cela correspond à un scénario où un annotateur estimerait seulement la taille des régions cancéreuses dans les images histologiques, réduisant le temps d’annotations requis pour effectuer une segmentation complète. Nous avons proposé une formulation qui permet d’utiliser cette information de taille et montré que cela augmente significativement les performances en segmentation comparé à ce qui peut être obtenu lors d’un entraînement avec des étiquettes au niveau de l’image seulement.
Type de document: | Mémoire ou thèse (Mémoire de maîtrise électronique) |
---|---|
Renseignements supplémentaires: | "Thesis presented to École de technologie supérieure in partial fulfillment for a master's degree with thesis in system engineering". Comprend des références bibliographiques (pages 136-145). |
Mots-clés libres: | diagnostic du cancer du sein, apprentissage faiblement supervisé, apprentissage profond |
Directeur de mémoire/thèse: | Directeur de mémoire/thèse Granger, Éric |
Codirecteur: | Codirecteur Ben Ayed, Ismail |
Programme: | Maîtrise en ingénierie > Génie de la production automatisée |
Date de dépôt: | 29 juin 2020 20:24 |
Dernière modification: | 26 févr. 2021 20:47 |
URI: | https://espace.etsmtl.ca/id/eprint/2486 |
Gestion Actions (Identification requise)
Dernière vérification avant le dépôt |