La vitrine de diffusion des mémoires et thèses de l'ÉTS
RECHERCHER

Extracting rules to help in the conversion of a relational database to NoSQL (column-oriented) database technology

Téléchargements

Téléchargements par mois depuis la dernière année

Ouanouki, Rafik (2020). Extracting rules to help in the conversion of a relational database to NoSQL (column-oriented) database technology. Thèse de doctorat électronique, Montréal, École de technologie supérieure.

[thumbnail of OUANOUKI_Rafik.pdf]
Prévisualisation
PDF
Télécharger (4MB) | Prévisualisation
[thumbnail of OUANOUKI_Rafik-web.pdf]
Prévisualisation
PDF
Télécharger (877kB) | Prévisualisation

Résumé

This research aims to support software engineers in their first attempt at a conversion of relational databases to a database technology recognized as better suited to cloud computing (NoSQL), which in this particular case study is HBase. To do this, an initial research activity aims to understand and clarify the notions of essential and optional characteristics in the cloud computing definition. This discussion is considered by taking the perspective of this research (i.e. a database conversion from RDB to NoSQL). Subsequently, the main contribution of this research explores the possibility of extracting database conversion rules.

Two experiments were carried out to identify an initial list of conversion rules:

1. The first experiment consisted of asking participants (engineers from École de technologie supérieure) to convert a particular schema, without the use of a guide or conversion rules. Several questionnaires were completed by the participants during the experiment. The main goal of this experiment was to evaluate the need for conversion rules to help software engineers in the conversion of relational schemas to non-relational schemas.

2. The second experiment consisted of dividing the participants into sub-groups tasked to convert a single RDB relation (i.e. one-to-one) to a possible schema in HBase. The goal was to test the results of a basic relationship compared with all the schematic conversion possibilities in HBase, a particular non-relational database, and then extract the conversion rules. This experiment would show why one particular schema is better than another and would allow for the identification of conversion rules based on facts (e.g., performance measurement of a query on each of the resulting schemas).

The main contributions of this thesis are:

1. A list of rules for converting relational database schemas to the schema of a non-relational database:
a. Rules on data proximity;
b. Rules on column families;
c. Rules on data quantity;
d. Rules on access patterns.

2. Clarification to the term cloud computing is also proposed by introducing the notion of mandatory and optional characteristics excluded from the most popular definition.

Titre traduit

Extraction des règles d’aide à la conversion de base de données relationnelles vers une technologie de base de données NoSQL (orientées colonnes)

Résumé traduit

Cette thèse vise à aider les ingénieurs logiciels lors d’une première conversion de bases de données relationnelles vers une technologie de base de données émergente reconnue pour être mieux adaptée à l’infonuagique, c’est-à-dire la technologie NoSQL. Pour ce faire, une première activité de recherche vise à comprendre et à clarifier les notions de caractéristiques essentielles et optionnelles de la définition du terme infonuagique. Cette discussion est abordée sous l’angle de cette recherche (c’est-à-dire lors d’une conversion de base de données relationnelle vers le NoSQL). Par la suite, la contribution principale de cette recherche explore la possibilité d’extraire des règles de conversion de base de données relationnelle vers une base de données non-relationnelle (NoSQL), plus précisément la technologie HBase.

Deux expérimentations ont été effectuées afin d’identifier une liste de règles de conversion :

1. La première expérimentation consistait à demander à des participants de convertir un schéma relationnel particulier sans l’utilisation de règles de conversions. Plusieurs questionnaires ont étés complétés par les participants durant l’expérimentation. L’objectif principal de cette première expérimentation était d’évaluer s’il y avait un besoin d’avoir accès à des règles de conversions afin d’aider les ingénieurs logiciels lors de la conversion de schémas relationnels vers des schémas non-relationnels ;

2. La deuxième expérimentation consistait à composer des groupes parmi les participants. Chaque groupe a eu comme tâche d’effectuer la conversion d’une relation simple, c.à.d. une à une, vers un des schémas possibles en HBase. L’objectif était de tester les résultats d’une relation SQL vers tous les schémas possibles dans HBase, une base de données non-relationnelle, afin d’extraire les règles de conversions. Cette expérimentation a permis de démontrer pourquoi un schéma particulier est meilleur qu’un autre et a aussi permis l’extraction de règles de conversion basés sur des faits (ex. mesure de performance d’une requête sur chacun des schémas résultants).

Les contributions principales de cette thèse sont:

1. Une liste de règles de conversion d’un schéma relationnel vers un schéma non relationnel:
a. Des règles portant sur la proximité des données ;
b. Des règles portant sur les familles de colonnes ;
c. Des règles portant sur la quantité de données ;
d. Des règles portant sur les modèles d’accès.

2. Une clarification de la définition du terme infonuagique proposée à l’aide de notions de caractéristiques obligatoires et d’éléments facultatifs exclus de la définition.

Type de document: Mémoire ou thèse (Thèse de doctorat électronique)
Renseignements supplémentaires: "Thesis presented to École de technologie supérieure in partial fulfillment for the degree of doctor of philosophy". Comprend des références bibliographiques (pages 128-134).
Mots-clés libres: règles de conversion de bases de données relationnelle, NoSQL, définition infonuagique, mégadonnées
Directeur de mémoire/thèse:
Directeur de mémoire/thèse
April, Alain
Programme: Doctorat en génie > Génie
Date de dépôt: 29 juin 2020 20:13
Dernière modification: 29 juin 2020 20:13
URI: https://espace.etsmtl.ca/id/eprint/2485

Gestion Actions (Identification requise)

Dernière vérification avant le dépôt Dernière vérification avant le dépôt