Kim, Ngoc Bach (2023). Privacy preservation in medical image analysis. Thèse de doctorat électronique, Montréal, École de technologie supérieure.
Prévisualisation |
PDF
Télécharger (3MB) | Prévisualisation |
Résumé
In recent years, the development of artificial intelligence (AI) algorithms has been the subject of tremendous progress brought namely by the rise of deep neural networks. Research works in AI have been translated into a broad range of applications, particularly, in the field of computer vision and natural language processing. In contrast, medical applications of AI have been slower to appear until now, largely due to privacy constraints on medical data.
The primary objective of this thesis is to develop novel deep learning methods for client-server medical image analysis, which also protect patient privacy. Toward this goal, three methods are proposed, each one associated with a distinct thesis chapter. These methods follow the same high-level strategy where a client (for instance, a hospital) encodes an image so that the sensitive information is obfuscated, before sending it to a server for analysis. The server processes the encoded image with a neural network designed to handle this data, and then sends the result back to the client where it is finally decoded. An important constraint to satisfy in this setting is never sending information that can be used to identify patients.
The first method, based on adversarial learning, is composed of three networks trained end-to-end: an encoder network which removes identity-specific features from the input image, a discriminator network that attempts to identify the corresponding subject from the encoded image, and a segmentation network which tries to extract regions of interest in the same image. By training the encoder to simultaneously fool the discriminator and maximize segmentation performance, it can learn to remove private features while keeping those essential for the segmentation task. The method’s ability to provide a high-quality segmentation, while also obfuscating patient identity, is demonstrated on the segmentation of brain MRI from the large-scale Parkinson Progression Marker Initiative (PPMI) dataset.
A limitation of the first approach is that it does not encode the segmentation maps produced by the network, which may also be used to identify the patient. The second method presented in the thesis, which aims to alleviate this problem, protects patient identity by applying a pseudorandom non-linear deformation to the input image. This results into a proxy image which is sent to the server for processing. The segmentation network then produces a deformed segmentation map in which the patient’s identity is protected. This map is sent back to the client where it is reverted back to a canonical form. The overall system has three components: a flow-field generator which produces a pseudo-random deformation function, a Siamese discriminator that tries to recover the patient identity from the processed image, and a segmentation network that analyzes the content of the proxy images. As in the first approach, the system is trained end-to-end in an adversarial manner. By fooling the discriminator, the flow-field generator learns to produce a reversible non-linear deformation which allows to remove information related to patient identity from both the input image and resulting segmentation map. The proposed method is once again validated on the task of MRI brain segmentation using images from two different datasets. Results show this method to offer a segmentation accuracy similar to a system trained on non-encoded images, while also reducing considerably the ability to recover subject identity.
The first two approaches use an adversarial learning strategy based on Siamese discriminators to encode the images to protect. However, training such discriminators requires to have several images for the same patient, which is not always possible in practice. Moreover, the adversarial training of the model is often unstable and the trained model can be sensitive to changes in the distribution of images. The last method explores a different strategy to preserve privacy. In this method, the client protects the to-be-segmented patient image by mixing it to a reference image, making it unworkable and unrecognizable for an unauthorized person. This proxy image is sent to a server for processing. The server then returns the mixture of segmentation maps to the client, which can revert it to a correct target segmentation. The system has two components: a segmentation network on the server side which processes the image mixture, and a segmentation “unmixing” network which recovers the correct segmentation map from the segmentation mixture. Once more, the whole system is trained end-to-end. The results of experiments on different datasets show that this method achieves a high or comparable segmentation accuracy with respect to previous approaches, while also being simpler to implement and requiring less computations than these approaches.
Titre traduit
Protection de la vie privée dans l’analyse d’images médicales
Résumé traduit
Ces dernières années, le développement d’algorithmes basés sur l’intelligence artificielle (IA) a fait des pas de géant, notamment grâce à l’essor de l’apprentissage automatisé basé sur les réseaux de neurones profonds. Les travaux de recherche dans ce domaine se sont traduits en un large éventail d’applications, principalement en vision par ordinateur et en analyse du langage naturel. En revanche, les applications médicales de l’IA tardent toujours à s’imposer, en grande partie dû aux contraintes de confidentialité et d’accès aux données médicales.
L’objectif principal de cette thèse est de développer des modèles d’apprentissage profond destinés à l’analyse d’images médicales dans un contexte client-serveur, et ce en protégeant la vie privée des patients. Pour ce faire, trois méthodes sont proposées, chacune associée à un chapitre distinct de la thèse. Les trois méthodes suivent une stratégie similaire à haut niveau, où un client (par exemple, un hôpital) encode une image de manière à masquer l’information confidentielle, avant d’envoyer celle-ci à un serveur. Le serveur traite l’image encodée à l’aide d’un réseau de neurones spécifiquement conçu pour ces données, et renvoie ensuite le résultat au client où il est décodé. Une contrainte importante à respecter dans ce contexte est de ne jamais transmettre de données contenant des informations pouvant permettre d’identifier un patient.
La première méthode comprend trois réseaux entraînés de bout en bout: un réseau encodeur retirant d’une image les caractéristiques spécifiques à l’identité du patient correspondant, un réseau discriminateur qui tente d’identifier le patient à partir de l’image encodée, et un réseau de segmentation pouvant extraire des régions d’intérêt dans cette même image. En entraînant l’encodeur de manière à simultanément tromper le discriminateur et maximiser la performance du réseau de segmentation, celui-ci apprend à supprimer les caractéristiques confidentielles tout en conservant celles qui sont essentielles à la tâche de segmentation. La capacité de cette approche à offrir une segmentation de qualité, tout en masquant l’identité des patients, est démontrée sur la segmentation d’IRM de cerveaux provenant de la base de données Parkinson Progression Marker Initiative (PPMI).
Une limitation de cette première approche est de ne pas encoder les cartes de segmentation produites par le réseau pouvant également être employées pour identifier le patient. La deuxième méthode présentée dans la thèse protège l’identité du patient en appliquant une déformation spatiale non linéaire pseudo-aléatoire à l’image d’entrée. Il en résulte une image distorsionnée qui est envoyée au serveur pour traitement. Le réseau de segmentation produit alors une carte déformée de segmentation où l’identité du patient est protégée. Cette carte est renvoyée au client qui remet celle-ci sous une forme canonique. Ce système comporte trois différentes composantes: un générateur de champ de flux qui produit une fonction de déformation pseudo-aléatoire, un discriminateur siamois qui tente de prédire l’identité du patient à partir de l’image traitée et un réseau de segmentation qui analyse le contenu des images encodées. Comme dans l’approche précédente, le système est entraîné de bout en bout avec une approche d’optimisation antagoniste.
En trompant le discriminateur, le générateur de champ de flux apprend à produire une déformation non linéaire réversible pouvant supprimer l’identité du patient à la fois dans l’image et la carte de segmentation correspondante. La méthode proposée est à nouveau validée sur la tâche de segmentation d’IRM de cerveaux provenant de deux ensembles de données différents. Les résultats montrent que cette méthode offre une précision de segmentation similaire à celle obtenue sur des images non encodées et, de plus, réduit considérablement la capacité à récupérer l’identité du sujet.
Les deux premières approches reposent sur l’apprentissage antagoniste à base de discriminateurs siamois pour encoder les images à protéger. Or, l’entraînement de tels discriminateurs nécessite plusieurs images pour un même patient, ce qui est rarement possible en pratique. De plus, l’entraînement antagoniste du modèle est souvent instable, et le modèle entraîné peut être sensible aux changements dans la distribution des images. La dernière méthode explore une stratégie différente pour préserver la confidentialité. Dans cette méthode, le client protège l’image du patient à segmenter en la mélangeant à une image de référence, rendant celle-ci inexploitable par une personne non autorisée. Cette image mélangée est envoyée à un serveur pour traitement. Le serveur renvoie ensuite au client le mélange de cartes de segmentation qui la ramène enfin à la segmentation cible. Le système complet comporte deux composantes: un réseau de segmentation du côté serveur qui traite le mélange d’images, et un réseau de “démixage” qui récupère la bonne carte de segmentation à partir du mélange de segmentations. Une fois de plus, le système est entraîné de bout en bout. Les résultats d’expériences sur différents jeux de données montrent que cette méthode obtient une segmentation de qualité supérieure ou comparable aux approches précédentes, tout en étant plus simple à implémenter et nécessitant moins de calculs que celles-ci.
Type de document: | Mémoire ou thèse (Thèse de doctorat électronique) |
---|---|
Renseignements supplémentaires: | "Manuscript-based thesis presented to École de technologie supérieure in partial fulfillment for the degree of doctor of philosophy". Comprend des références bibliographiques (pages 125-144). |
Mots-clés libres: | vie privée, segmentation d’images médicales, apprentissage antagoniste, apprentissage de représentations |
Directeur de mémoire/thèse: | Directeur de mémoire/thèse Desrosiers, Christian |
Codirecteur: | Codirecteur Dolz, José Jodoin, Pierre-Marc |
Programme: | Doctorat en génie > Génie |
Date de dépôt: | 14 mars 2024 16:01 |
Dernière modification: | 14 mars 2024 16:01 |
URI: | https://espace.etsmtl.ca/id/eprint/3432 |
Gestion Actions (Identification requise)
Dernière vérification avant le dépôt |