La vitrine de diffusion des mémoires et thèses de l'ÉTS
RECHERCHER

Comparaison de modèles semi-supervisés pour la reconnaissance d'images histologiques

Téléchargements

Téléchargements par mois depuis la dernière année

Shorten, Lucas (2019). Comparaison de modèles semi-supervisés pour la reconnaissance d'images histologiques. Mémoire de maîtrise électronique, Montréal, École de technologie supérieure.

[thumbnail of SHORTEN_Lucas.pdf]
Prévisualisation
PDF
Télécharger (10MB) | Prévisualisation
[thumbnail of SHORTEN_Lucas-web.pdf]
Prévisualisation
PDF
Télécharger (797kB) | Prévisualisation

Résumé

L’étude d’images histologiques est une tâche particulièrement importante pour le diagnostic du cancer du sein. Cette tâche complexe et fastidieuse pourrait être assistée par l’utilisation de réseaux d’apprentissage profond. En effet, ces réseaux profonds forment l’état de l’art dans la reconnaissance visuelle, notamment sur les bases d’images histologiques. Cependant, ce type de modèle nécessite une grande quantité d’images annotées, qui ne sont pas toujours accessibles en histologie. Ces travaux se sont attachés à évaluer l’impact de l’utilisation de données sans annotations sur les performances des modèles compétitifs actuels. Ce projet vise à étudier le comportement des techniques semi-supervisées Ladder Network, Virtual Adversarial Training, Mean Teacher et Deep Co-training aux variations des données annotées et non annotées. Ces techniques ont été évaluées sur la base BACH et la base TUPAC, composées d’images histologiques pour lutter contre le cancer du sein. Les résultats obtenus montrent que l’apport des données non annotées est particulièrement intéressant lorsque l’on possède une faible quantité de données annotées. De plus, l’ordre de performances des différentes approches dépend de la base de données utilisée. Puis, différentes configurations avec l’approche Deep Co-training ont été étudiées, cette approche étant l’une des techniques les plus compétitives dans ce domaine. Les essais ont montré que l’ajout de modèles supplémentaires permet d’obtenir de meilleures performances bien qu’il faille faire attention aux problèmes de corruption. Augmenter la diversité des modèles permet, jusqu’à une certaine limite, d’améliorer les performances obtenues. Enfin, des données supplémentaires générées par l’approche BadGan ont été utilisées. Cette dernière approche permet d’ajouter une fonction de coût supplémentaire qui se trouve être bénéfique, dans le cas étudié, au prix de l’augmentation de la complexité.

Titre traduit

Computer-aided diagnostic with deep networks for semi-supervised learning

Résumé traduit

The study of histological images is particularly important task for the diagnosis of breast cancer. This complex and time-consuming task could be assisted by the use of deep learning networks. Indeed, these deep networks are the state of the art in visual recognition, notably on histological images datasets. However, this type of model requires a large number of annotated images, which are not always available in histology. This work focused on assessing the impact of using data without annotation on the performance of current competitive models. In this project, we studied the behaviour of semi-supervised techniques Ladder Network, Virtual Adversarial Training, Mean Teacher and Deep Co-training to variations in labelled and unlabelled data. These techniques were evaluated on BACH and TUPAC datasets, composed of histological images to fight breast cancer. The results show that the contribution of non-annotated data is especially interesting when there is a small amount of annotated data. In addition, the order of performance of the different approaches depends on the database used. Then, different configurations with the Deep Co-training approach were studied, this approach being one of the most competitive techniques in this field. Tests have shown that adding additional models leads to better performance, although attention should be paid to corruption issues. Increasing the diversity of models allows, up to a certain limit, to improve the performance obtained. Finally, additional data generated by the BadGan approach were used. This last approach makes it possible to add an additional cost function that is beneficial, in the case studied, at the cost of increasing complexity.

Type de document: Mémoire ou thèse (Mémoire de maîtrise électronique)
Renseignements supplémentaires: "Mémoire présenté à l'École de technologie supérieure comme exigence partielle à l'obtention de la maîtrise avec mémoire en génie de la production automatisée". Comprend des références bibliographiques (pages 115-121).
Mots-clés libres: apprentissage semi-supervisé, diagnostic assisté par ordinateur, images histologiques, apprentissage profond
Directeur de mémoire/thèse:
Directeur de mémoire/thèse
Granger, Éric
Programme: Maîtrise en ingénierie > Génie de la production automatisée
Date de dépôt: 26 nov. 2019 19:48
Dernière modification: 26 nov. 2019 19:48
URI: https://espace.etsmtl.ca/id/eprint/2410

Gestion Actions (Identification requise)

Dernière vérification avant le dépôt Dernière vérification avant le dépôt