La vitrine de diffusion des mémoires et thèses de l'ÉTS
RECHERCHER

Enhancing sensor systems through sensor drift identification and compensation using Jensen-Shannon divergence and CTGAN

Téléchargements

Téléchargements par mois depuis la dernière année

Mahinnezhad, Shima (2025). Enhancing sensor systems through sensor drift identification and compensation using Jensen-Shannon divergence and CTGAN. Mémoire de maîtrise électronique, Montréal, École de technologie supérieure.

[thumbnail of Mahinnezhad_Shima.pdf]
Prévisualisation
PDF
Télécharger (6MB) | Prévisualisation

Résumé

Many modern gas detection systems use machine learning (ML) to achieve consistent accuracy, even in the face of challenges like sensor drift and class imbalance. Sensor drift refers to the gradual decline in a sensor’s performance over time, which makes it difficult for ML models to correctly identify gas types. Additionally, many gas detection datasets are imbalanced, meaning that some gas types are underrepresented, which affects the performance of the models.

To address these challenges, two important techniques are used, in this work, namely, sensor drift detection and data augmentation. However, current methods often struggle to handle the complexity of gradual or non-linear drift along with the imbalanced datasets. Moreover, traditional data augmentation techniques are often not suitable for tabular data, which is commonly used in sensor-based systems.

This thesis introduces a novel approach that uses Jensen-Shannon (JS) divergence to detect and measure sensor drift, and Conditional Tabular Generative Adversarial Networks (CTGAN) to generate synthetic data that improves dataset balance and compensates for class imbalance. JS divergence allows us to precisely identify sensor drift by comparing the probability distributions of sensor data over time, helping us better understand how drift affects classification accuracy. CTGAN is used to create high-quality synthetic tabular data, ensuring better representation of minority gas classes.

Our research focuses on a gas sensor dataset collected over 36 months, which includes multiple batches of sensor readings. We use JS divergence to detect and measure drift, and CTGAN to generate synthetic data that addresses both sensor drift and class imbalance. This combination of JS divergence and CTGAN is applied for the first time to improve the accuracy of gas detection systems.

By evaluating ML models such as SVM and MLP, we demonstrate significant improvements in classification accuracy, with gains of up to 20% in some batches. Our findings highlight the effectiveness of this approach in addressing both sensor drift and data imbalance, contributing to a better understanding of how to improve gas detection systems.

In summary, this thesis makes important contributions to the fields of sensor drift detection and data augmentation in gas detection systems. It presents a new methodology for quantifying drift using JS divergence and addresses class imbalance with CTGAN, enhancing the accuracy and reliability of ML models in sensor-based applications.

Titre traduit

Amélioration des systèmes de capteurs grâce à l’identification et la compensation de la dérive des capteurs en utilisant la divergence de Jensen-Shannon et CTGAN

Résumé traduit

De nombreux systèmes modernes de détection de gaz utilisent l’apprentissage automatique (ML) pour maintenir une précision constante, même face à des défis tels que la dérive des capteurs et le déséquilibre des classes. La dérive des capteurs fait référence à la diminution progressive des performances d’un capteur au fil du temps, ce qui complique l’identification correcte des types de gaz par les modèles de ML. De plus, de nombreux ensembles de données de détection de gaz sont déséquilibrés, ce qui signifie que certains types de gaz sont sous-représentés, ce qui affecte les performances des modèles.

Pour relever ces défis, deux techniques importantes sont utilisées dans ce travail, à savoir la détection de dérive des capteurs et l’augmentation de données. Cependant, les méthodes actuelles ont souvent du mal à gérer la complexité des dérives progressives ou non linéaires ainsi que des ensembles de données déséquilibrés. En outre, les techniques traditionnelles d’augmentation de données ne sont souvent pas adaptées aux données tabulaires, qui sont couramment utilisées dans les systèmes à base de capteurs.

Cette thèse propose une approche novatrice qui utilise la divergence de Jensen-Shannon (JS) pour détecter et mesurer la dérive des capteurs, et des réseaux adverses génératifs tabulaires conditionnels (CTGAN) pour générer des données synthétiques améliorant l’équilibre des ensembles de données et compensant le déséquilibre des classes. La divergence JS permet d’identifier précisément la dérive des capteurs en comparant les distributions de probabilité des données des capteurs au fil du temps, ce qui aide à mieux comprendre comment la dérive affecte la précision de la classification. CTGAN est utilisé pour créer des données tabulaires synthétiques de haute qualité, assurant une meilleure représentation des classes de gaz minoritaires.

Notre recherche se concentre sur un ensemble de données de capteurs de gaz collectées sur 36 mois, incluant plusieurs lots de relevés de capteurs. Nous utilisons la divergence JS pour détecter et mesurer la dérive, et CTGAN pour générer des données synthétiques qui répondent à la fois à la dérive des capteurs et au déséquilibre des classes. Cette combinaison de divergence JS et CTGAN est appliquée pour la première fois afin d’améliorer la précision des systèmes de détection de gaz.

En évaluant des modèles de ML tels que SVM et MLP, nous démontrons des améliorations significatives de la précision de classification, avec des gains allant jusqu’à 20% dans certains lots. Nos résultats mettent en évidence l’efficacité de cette approche pour traiter à la fois la dérive des capteurs et le déséquilibre des données, contribuant à une meilleure compréhension des moyens d’améliorer les systèmes de détection de gaz.

En résumé, cette thèse apporte des contributions importantes aux domaines de la détection de dérive des capteurs et de l’augmentation de données dans les systèmes de détection de gaz. Elle présente une nouvelle méthodologie pour quantifier la dérive à l’aide de la divergence JS et aborde le déséquilibre des classes avec CTGAN, améliorant ainsi la précision et la fiabilité des modèles de ML dans les applications basées sur des capteurs.

Type de document: Mémoire ou thèse (Mémoire de maîtrise électronique)
Renseignements supplémentaires: "Thesis presented to École de technologie superieure in partial fulfillment of a master’s degree with thesis in electrical engineering". Comprend des références bibliographiques (pages 91-99).
Mots-clés libres: CTGAN, divergence de Jensen-Shannon, équilibrage des données, augmentation de données, modèles génératifs, systèmes de capteurs
Directeur de mémoire/thèse:
Directeur de mémoire/thèse
Shih, Andy
Codirecteur:
Codirecteur
Kaur, Kuljeet
Programme: Maîtrise en ingénierie > Génie électrique
Date de dépôt: 05 juin 2025 18:56
Dernière modification: 05 juin 2025 18:56
URI: https://espace.etsmtl.ca/id/eprint/3640

Gestion Actions (Identification requise)

Dernière vérification avant le dépôt Dernière vérification avant le dépôt