La vitrine de diffusion des mémoires et thèses de l'ÉTS
RECHERCHER

Agnostic content ontology design patterns for a multi-domain ontology

Téléchargements

Téléchargements par mois depuis la dernière année

Plus de statistiques...

Fitzpatrick, Daniel (2018). Agnostic content ontology design patterns for a multi-domain ontology. Thèse de doctorat électronique, Montréal, École de technologie supérieure.

[thumbnail of FITZPATRICK_Daniel.pdf]
Prévisualisation
PDF
Télécharger (1MB) | Prévisualisation
[thumbnail of FITZPATRICK_Daniel-web.pdf]
Prévisualisation
PDF
Télécharger (1MB) | Prévisualisation

Résumé

This research project aims to solve the semantic heterogeneity problem. Semantic heterogeneity mimics cancer in that semantic heterogeneity unnecessarily consumes resources from its host, the enterprise, and may even affect lives. A number of authors report that semantic heterogeneity may cost a significant portion of an enterprise’s IT budget. Also, semantic heterogeneity hinders pharmaceutical and medical research by consuming valuable research funds.

The RA-EKI architecture model comprises a multi-domain ontology, a cross-industry agnostic construct composed of rich axioms notably for data integration. A multi-domain ontology composed of axiomatized agnostic data model patterns would drive a cognitive data integration application system usable in any industry sector. This project’s objective is to elicit agnostic data model patterns here considered as content ontology design patterns. The first research question of this project pertains to the existence of agnostic patterns and their capacity to solve the semantic heterogeneity problem. Due to the theory-building role of this project, a qualitative research approach constitutes the appropriate manner to conduct its research. Contrary to theory testing quantitative methods that rely on well-established validation techniques to determine the reliability of the outcome of a given study, theorybuilding qualitative methods do not possess standardized techniques to ascertain the reliability of a study. The second research question inquires on a dual method theory-building approach that may demonstrate trustworthiness. The first method, a qualitative Systematic Literature Review (SLR) approach induces the sought knowledge from 69 retained publications using a practical screen. The second method, a phenomenological research protocol elicits the agnostic concepts from semi-structured interviews involving 22 senior practitioners with 21 years in average of experience in conceptualization.

The SLR retains a set of 89 agnostic concepts from 2009 through 2017. The phenomenological study in turn retains 83 agnostic concepts. During the synthesis stage for both studies, data saturation was calculated for each of the retained concepts at the point where the concepts have been selected for a second time. The quantification of data saturation constitutes an element of the trustworthiness’s transferability criterion. It can be argued that this effort of establishing the trustworthiness, i.e. credibility, dependability, confirmability and transferability can be construed as extensive and this research track as promising. Data saturation for both studies has still not been reached. The assessment performed in the course of the establishment of trustworthiness of this project’s dual method qualitative research approach yields very interesting findings. Such findings include two sets of agnostic data model patterns obtained from research protocols using radically different data sources i.e. publications vs. experienced practitioners but with striking similarities. Further work is required using exactly the same protocols for each of the methods, expand the year range for the SLR and to recruit new co-researchers for the phenomenological protocol. This work will continue until these protocols do not elicit new theory material. At this point, new protocols for both methods will be designed and executed with the intent to measure theoretical saturation. For both methods, this entails in formulating new research questions that may, for example, focus on agnostic themes such as finance, infrastructure, relationships, classifications, etc. For this exploration project, the road ahead involves the design of new questionnaires for semi-structured interviews. This project will need to engage in new knowledge elicitation techniques such as focus groups. The project will definitely conduct other qualitative research methods such as research action for eliciting new knowledge and know-how from actual development and operation of an ontology-based cognitive application. Finally, a mixed methods qualitative-quantitative approach would prepare the transition toward theory testing method using hypothetico-deductive techniques.

Titre traduit

Patrons de conception d'ontologie de contenu agnostique pour une ontologie multi-domaines

Résumé traduit

Ce projet de recherche vise à résoudre le problème d'hétérogénéité sémantique. L'hétérogénéité sémantique ressemble au cancer en ce sens qu’il consomme inutilement des ressources de son hôte, l'entreprise, et peut même affecter des vies. Un certain nombre d'auteurs signalent que l'hétérogénéité sémantique peut coûter une part importante du budget informatique d'une entreprise. En outre, l'hétérogénéité sémantique affecte la recherché pharmaceutique et médicale qui vise à préserver des vies en consommant de précieux fonds de recherche.

Le modèle d'architecture RA-EKI comprend une ontologie multidomaines, une construction agnostique interindustrielle composée d'axiomes riches, notamment pour l'intégration de données. Une ontologie multidomaines composée de patrons de modèles de données agnostiques axiomatisés conduirait un système d'application d'intégration de données cognitives utilisable dans n'importe quel secteur industriel. L'objectif de ce projet est d'obtenir des patrons de modèles de données agnostiques considérés ici comme des patrons de conception d'ontologies de contenu. La thèse de ce projet est que de tels patrons agnostiques existent et peuvent être utilisés pour résoudre le problème d'hétérogénéité sémantique. En raison du rôle de construction théorique de ce projet, une approche de recherche qualitative constitue la manière appropriée de mener ses recherches. Contrairement aux méthodes quantitatives de tests théoriques qui reposent sur des techniques de validation bien établies pour déterminer la fiabilité du résultat d'une étude donnée, les methods qualitatives de construction de la théorie ne possèdent pas de techniques standardisées pour vérifier la fiabilité d'une étude. Ce projet comporte deux questions de recherche. La première question porte sur l’existence de patrons de modèle de données qui peuvent s’appliquer à tout secteur d’industrie et qui peuvent permettre de résoudre le problème d’hétérogénéité sémantique. La deuxième question de recherche, de nature méthodologique, porte sur l’existence d’approche de construction de théorie à deux méthodes en vue d’inspirer la confiance dans ladite approche. La première méthode, une approche de revue de literature systématique qualitative, induit les connaissances recherchées dans 69 publications retenues en utilisant un écran pratique. La deuxième méthode, une approche de recherché phénoménologique, élicite les concepts agnostiques à partir d'entrevues semi-structures impliquant 22 praticiens seniors avec en moyenne 21 ans d'expérience en conceptualisation.

La SLR retient un ensemble de 89 concepts agnostiques publiés entre 2009 à 2017. L'étude phénoménologique retient à son tour 83 concepts agnostiques. Au cours de la phase de synthèse pour les deux études, la saturation des données a été calculée pour chacun des concepts retenus au point où les concepts ont été sélectionnés pour la deuxième fois. La saturation des données représente le point où aucun nouvel élément théorique ne s’ajoute avec le même protocole de recherche. La quantification de la saturation des données constitue un élément du critère de transférabilité de la fiabilité. On peut faire valoir que cet effort visant à établir la fiabilité, c'est-à-dire la crédibilité, la fiabilité, la confirmabilité et la transférabilité, peut être considéré comme intensif et que cette recherche est prometteuse. La saturation des données pour les deux études n'a toujours pas été atteinte.

L'évaluation réalisée dans le cadre de l'établissement de la fiabilité de l'approche de recherché qualitative à double méthode de ce projet donne des résultats très intéressants. Ces résultats comprennent deux séries de patrons de modèles de données agnostiques obtenus à partir des protocoles de recherche en utilisant des sources de données radicalement différentes, c'est-à-dire des publications par rapport à des praticiens expérimentés, mais avec des similarities frappantes. Des travaux supplémentaires sont nécessaires en utilisant exactement les memes protocoles pour chacune des méthodes, élargir la gamme de l'année pour le SLR et recruiter de nouveaux cochercheurs pour le protocole phénoménologique. Ce travail se poursuivra jusqu'à ce que ces protocoles n'élisent pas de nouveaux matériaux théoriques. À ce stade, de nouveaux protocoles pour les deux méthodes seront conçus et exécutés dans le but de mesurer la saturation théorique. Pour les deux méthodes, cela implique de formuler de nouvelles questions de recherche qui peuvent, par exemple, porter sur des themes agnostiques tels que la finance, l'infrastructure, les relations, les classifications, etc. Pour ce projet d'exploration, la conception de nouveaux questionnaires des entrevues structurées, de nouvelles techniques d'élicitation des connaissances telles que des groupes de discussion et éventuellement d'autres méthodes de recherche qualitative telles que l'action de recherche pour obtenir de nouvelles connaissances et savoir-faire du développement et du fonctionnement réels d'une application cognitive ontologique. Enfin, une approche mixte qualitative quantitative préparerait la transition vers des méthodes hypothético-déductives.

Type de document: Mémoire ou thèse (Thèse de doctorat électronique)
Renseignements supplémentaires: "Manuscript-based thesis presented to École de technologie supérieure in partial fulfillment of the requirements for the degree of doctor of philosophy" Comprend des références bibliographiques (pages 275-296).
Mots-clés libres: patrons de modèles de données, patrons de conception d'ontologies de contenu, ontologie multidomaines, recherche qualitative, revue de litérature systématique, méthode de recherche phénoménologique
Directeur de mémoire/thèse:
Directeur de mémoire/thèse
Coallier, François
Codirecteur:
Codirecteur
Ratté, Sylvie
Programme: Doctorat en génie > Génie
Date de dépôt: 08 mars 2019 18:49
Dernière modification: 08 mars 2019 18:49
URI: https://espace.etsmtl.ca/id/eprint/2225

Gestion Actions (Identification requise)

Dernière vérification avant le dépôt Dernière vérification avant le dépôt