La vitrine de diffusion des mémoires et thèses de l'ÉTS
RECHERCHER

Effects of data exploration and use of data mining tools to extract knowledge from databases (KDD) in early stages of the Engineering design process (EDP)

Escandon-Quintanilla, Ma Lorena (2017). Effects of data exploration and use of data mining tools to extract knowledge from databases (KDD) in early stages of the Engineering design process (EDP). Thèse de doctorat électronique, Montréal, École de technologie supérieure.

[img]
Prévisualisation
PDF
Télécharger (5MB) | Prévisualisation
[img]
Prévisualisation
PDF
Télécharger (819kB) | Prévisualisation

Résumé

This thesis describes original research work where the objective was to provide teams with access to data, and observe the effect of its use at the early creative stages of the engineering design process. Following a theoretical research on the use of information technologies to support idea generation, and the use of data as creative input, a procedure was designed following the Knowledge Discovery from Databases process, and tried over several iterations of improvement working with creative teams in different contexts.

After two exploratory studies, three cases were performed where the researcher attempted to better support the different stages of the EDP through the application of data from patent mining. To observe the differences, we provided three levels of access to explore data in a data mining tool: low, intermediate and high.

• Case 1 - Participants in a creativity session were asked to identify needs or problems (first stage of the engineering design process). They were given intermediate access to explore data in a data mining tool, meaning they could explore, but not make new searches or add data. The analysis of the results indicates that participants gravitated towards terms and keywords related to previously generated ideas, thus the increase in novelty was low. In order to correct the issue of intermediate exploration, it was decided to train participants in the use of the data mining tool for subsequent cases; if teams have more freedom to explore data, they can potentially generate more novel combinations.

• Case 2 - Teams tasked with engineering challenges in a course were trained in the use of the data exploration tool. They were then invited to continue using the tool to generate new ideas. In this case, teams had high access to the data exploration tool; they were able to add data, and make searches. Teams who chose to explore data for creative support found improvements or components from existing solutions to advance their own design, and received more positive evaluations by a jury of experts. However, the objective of obtaining more diverse or novel solutions was not achieved. A possible explanation is that the use of the tool can overwhelm participants with too many options to explore, leading teams to return to known solutions. A possible counteraction to resolve the issue of too many options is to have an external actor (such as a moderator) extract keywords from the data, and provide participants with these terms to combine into novel ideas.

• Case 3 - Teams participating in an innovation contest were given keywords selected by an expert on the tool. In other words, participants had low access to explore data in a data mining tool. The researcher performed the data analysis for two challenges in the competition, and selected keywords relevant to the knowledge base of the problem. The results show that teams who selected the keyword supported challenges generated more diverse and novel ideas, compared to teams without the support. By providing relevant keywords, it was possible to obtain the benefits of the KDD without the issues of training participants on the use of the tool, and the resources teams would have to dedicate to explore the data.

It was concluded that data and KDD can be used as a creative input for an EDP at different stages. It is recommended to determine whether the objective of including data in an EDP effort is to generate a novel idea or to solve a problem. To generate novel ideas, it seems preferable to provide data in the form of keywords selected by an external actor, to prompt original combinations. If the team is searching for incremental improvements or elements of existing solutions, then it appears to be beneficial to have access to a knowledge base to explore. It is important to delimit the exploration to avoid becoming stunned because of the amount of available information.

For the three experiences, the software IPMetrix was used to perform the data mining. The process of data selection, loading, cleaning and transformation is described in each chapter, according to the work performed on the data for the specific case.

Titre traduit

Effets de l'exploration de données et de l'utilisation d'outils de Data mining pour extraire des connaissances à partir de bases de données (KDD) dans les premières étapes du processus de conception d'ingénierie (EDP)

Résumé traduit

Cette thèse décrit des travaux de recherche originaux dont l'objectif était de fournir aux équipes l'accès aux données et d'observer l'effet de son utilisation aux premières étapes créatives du processus de conception d’ingénierie. À la suite d'une recherche théorique sur l'utilisation des technologies de l'information pour soutenir la génération d'idées et l'utilisation des données comme entrée créatif, une procédure a été conçue suite au processus de découverte de la connaissance des bases de données (KDD) et testée sur plusieurs itérations d'amélioration travaillant avec des équipes créatives dans différents contextes.

Après deux études exploratoires, trois cas ont été réalisés où le chercheur a tenté de mieux appuyer les différentes étapes du EDP par l'application de données provenant de l'exploitation des brevets. Pour observer les différences, nous avons fourni trois niveaux d'accès pour explorer les données dans un outil de data mining: bas, intermédiaire et élevé.

• Cas 1 - Les participants à une séance de créativité ont été invités à identifier des besoins ou des problèmes (première étape du processus de conception d’ingénierie). Ils ont eu un accès intermédiaire pour explorer les données dans un outil de data mining; ils pourraient explorer, mais pas faire de nouvelles recherches ou ajouter des données. L'analyse des résultats indique que les participants gravitent vers des termes et des mots-clés liés à des idées précédemment générées, de sorte que l'augmentation de la nouveauté est faible. Afin de corriger la question de l'exploration intermédiaire, il a été décidé de former les participants à l'utilisation de l'outil de data mining pour les cas suivants; si les équipes ont plus de liberté pour explorer les données, ells peuvent générer des combinaisons plus nouvelles.

• Cas 2 - Les équipes chargées de relever les défis techniques d'un cours ont été formées à l'utilisation de l'outil d'exploration de données. Ils ont ensuite été invités à continuer à utiliser l'outil pour générer de nouvelles idées. Dans ce cas, les equips avaient un accès élevé à l'outil d'exploration de données; ils ont pu ajouter des données et effectuer des recherches. Les équipes qui ont choisi d'explorer les données pour un soutien créatif ont trouvé des améliorations ou des composants à partir de solutions existantes pour faire avancer leur propre conception, et ont reçu des évaluations plus positives par un jury d'experts. Cependant, l'objectif d'obtenir des solutions plus diverses ou nouvelles n'a pas été atteint. Une explication possible est que l'utilisation de l'outil peut surcharger les participants avec trop d'options à explorer, menant les équipes à revenir aux solutions connues. Une contre-réaction possible pour résoudre la question de trop d'options est d'avoir un acteur externe (comme un modérateur) extraire des mots-clés à partir des données, et de fournir aux participants ces termes pour combiner dans des idées nouvelles.

• Cas 3 - Les équipes participant à un concours d'innovation ont reçu des mots clés choisis par un expert sur l'outil. Les participants avaient un faible accès à explorer les données dans un outil de data mining. Le chercheur a effectué l'analyse des données pour deux défis dans la compétition, et a sélectionné des mots clés pertinents provenant de la base de connaissances du problème. Les résultats montrent que les équipes qui ont choisi les défis supporté par les mots-clés ont généré des idées plus diverses et nouvelles, par rapport aux équipes sans le soutien. En fournissant des mots-clés pertinents, il était possible d'obtenir les avantages du KDD sans les questions de formation des participants sur l'utilisation de l'outil, et les ressources qui les équipes devraient consacrer pour explorer les données.

En conclusion, les données et le KDD peuvent être utilisés comme une entrée créative pour un EDP à différentes étapes. Il est recommandé de déterminer si l'objectif d'inclure des données dans un effort EDP est de générer une idée nouvelle ou de résoudre un problème. Pour générer des idées nouvelles, il semble préférable de fournir des données sous la forme de mots-clés sélectionnés par un acteur externe, pour inciter les combinaisons originales. Si l'équipe recherche des améliorations ou des éléments de solutions existantes, il semble bénéfique d'avoir accès à une base de connaissances à explorer. Il est important de delimiter l'exploration afin de ne pas être étourdis en raison de la quantité d'information disponible.

Pour les trois expériences, le logiciel IPMetrix a été utilisé pour effectuer l'exploration de données. Le processus de sélection, de chargement, de nettoyage et de transformation des données est décrit dans chaque chapitre, en fonction du travail effectué sur les données pour le cas spécifique.

Type de document: Mémoire ou thèse (Thèse de doctorat électronique)
Renseignements supplémentaires: "Manuscript-based thesis presented to École de Technologie supérieure in partial fulfillment for the degree of doctor of philosophy". Bibliographie : pages 145-150.
Mots-clés libres: Conception technique. Exploration de données (Informatique) Bases de données Interrogation. Données volumineuses. Acquisition des connaissances (Systèmes experts) Conception technique Informatique. Exploration de données (Informatique) Logiciels. Brevets d'invention Recherche documentaire. Créativité en technologie. processus de conception d'ingénierie, découverte de connaissances, extraction de brevets
Directeur de mémoire/thèse:
Directeur de mémoire/thèse
Gardoni, Mickaël
Co-directeurs de mémoire/thèse:
Co-directeurs de mémoire/thèse
Cohendet, Patrick
Programme: Doctorat en génie > Génie
Date de dépôt: 24 juill. 2017 15:21
Dernière modification: 24 juill. 2017 15:21
URI: http://espace.etsmtl.ca/id/eprint/1912

Actions (Identification requise)

Dernière vérification avant le dépôt Dernière vérification avant le dépôt

Statistique

Plus de statistique...