La vitrine de diffusion des mémoires et thèses de l'ÉTS
RECHERCHER

GNOMEViewer : visualisateur interactif de mutations somatiques

Téléchargements

Téléchargements par mois depuis la dernière année

Plus de statistiques...

Kanzki, Beatriz (2019). GNOMEViewer : visualisateur interactif de mutations somatiques. Mémoire de maîtrise électronique, Montréal, École de technologie supérieure.

[img]
Prévisualisation
PDF
Télécharger (13MB) | Prévisualisation
[img]
Prévisualisation
PDF
Télécharger (665kB) | Prévisualisation

Résumé

Les techniques de séquençage de nouvelle génération (NGS) offrent désormais de nouvelles perspectives aux chercheurs en oncogénomique. Ces techniques sont très utiles et donnent accès à de l’information cruciale pour la recherche en détectant et identifiant rapidement les possibles mutations génétiques afin de diagnostiquer des maladies ou d’améliorer leurs traitements. Afin de l’utiliser efficacement, il est primordial que chaque chercheur puisse traiter, explorer et interpréter, avec soin et rapidement, cette grande quantité de données. Les recherches en oncologie progressent rapidement. Elles produisent de nouvelles connaissances et génèrent de nouveaux résultats continuellement grâce à des projets collaboratifs, à grande échelle, qui offrent librement l’accès à des données cliniques et génomiques sur le cancer.

Malheureusement, peu de chercheurs peuvent utiliser ces informations à leur plein potential même si elles sont disponibles publiquement. Entre la taille grandissante, la complexité des données générées par les technologies NGS et le nombre de bases de données hétérogènes publiques disponibles aux chercheurs ; l’analyse et l’exploration de cette information complexe et de grande taille posent un grand défi pour le chercheur typique.

Ce rapport de recherche présente les décisions de conception, les fonctionnalités, la structure ainsi que le processus de conversion de données d’un prototype logiciel nommé GNOMEViewer, spécialisé dans la visualisation de mutations somatiques liées au cancer. Ce prototype logiciel vise à faciliter la visualisation de ces données pour les chercheurs en oncologie. GNOMEViewer permet, entre autres, de comparer les données provenant de patients à celles contenues dans les bases de données publiques.

GNOMEViewer a été conçu à l’aide de technologies « Big Data » du domaine du logiciel libre telles que Spark, Parquet, et le format de fichier de l’Université Berkeley, Analysis Data Model (ADAM) qui peut facilement opérer dans le nuage. L’objectif de cette recherche est que GNOMEViewer devienne l’outil de référence pour la visualisation de mutations somatiques pour les chercheurs en oncologie.

Titre traduit

GNOMEViewer : interactive somatic mutation vizualiser

Résumé traduit

Next Generation Sequencing (NGS) techniques now provide new opportunities for oncogenomics researchers. These techniques are very useful and provide access to crucial information for research by detecting and quickly identifying possible genetic mutations to diagnose diseases or improve treatments. In order to use them effectively, it is essential that each researcher has the ability to process, explore and interpret this large amount of data carefully and quickly. Oncology research is progressing rapidly. New knowledge and new results are continually generated through large-scale collaborative projects that provide open access to clinical and genomic cancer data.

Unfortunately, few researchers can use this information to its full potential even if it is publicly available. The growing size and complexity of data generated by NGS technologies and the number of public heterogeneous databases available to researchers make the analysis and exploration of information a great challenge for the typical researcher.

This applied research report presents the design decisions, functionalities, structure, and data conversion process demonstrated in a software prototype named GNOMEViewer, which specializes in the visualization of somatic cancer-related mutations. The software prototype aims to facilitate the visualization of complex data for oncology researchers. The objective of this research is to show that this, easy to use user interface design, enables cancer researchers to seamlessly compare their patient’s data against publicly available databases.

GNOMEViewer was designed using Spark, Parquet, and the University of Berkeley’s Berkeley Genomics Format (ADAM) that are all open source Big Data technologies, which can easily scale on demand in the cloud. Our hope is that GNOMEViewer becomes the future reference tool for the visualization of somatic mutations for oncology researchers.

Type de document: Mémoire ou thèse (Mémoire de maîtrise électronique)
Renseignements supplémentaires: "Mémoire présenté à l'École de technologie supérieure comme exigence partielle à l'obtention de la maîtrise en génie avec mémoire concentration génie logiciel". Comprend des références bibliographiques (pages 81-88).
Mots-clés libres: bio-informatique, Big Data, AWS, cloud computing, génomique, medicine personnalisée, visualisateur génomique, Spark, Paquet, ADAM genomics, HDFS, EC2, Hadoop, EMR, S3, architecture logiciel
Directeur de mémoire/thèse:
Directeur de mémoire/thèse
April, Alain
Programme: Maîtrise en ingénierie > Génie
Date de dépôt: 08 avr. 2019 20:28
Dernière modification: 08 avr. 2019 20:28
URI: http://espace.etsmtl.ca/id/eprint/2262

Actions (Identification requise)

Dernière vérification avant le dépôt Dernière vérification avant le dépôt