La vitrine de diffusion des mémoires et thèses de l'ÉTS
RECHERCHER

Stratégies de contrôle avancées pour systèmes de production sous contraintes environnementales : politiques intégrées et apprentissage par renforcement

Téléchargements

Téléchargements par mois depuis la dernière année

Aarab, Hassan (2025). Stratégies de contrôle avancées pour systèmes de production sous contraintes environnementales : politiques intégrées et apprentissage par renforcement. Mémoire de maîtrise électronique, Montréal, École de technologie supérieure.

[thumbnail of AARAB_Hassan.pdf]
Prévisualisation
PDF
Télécharger (2MB) | Prévisualisation

Résumé

Cette recherche développe et valide des stratégies de contrôle pour les systèmes manufacturiers non fiables opérant sous contraintes environnementales. L’approche proposée combine deux méthodologies distinctes : la programmation dynamique stochastique combinée avec la résolution numérique pour les configurations hybrides, et l’intelligence artificielle par apprentissage par renforcement pour les systèmes simples.

La première contribution porte sur le contrôle des systèmes de production hybrides intégrant fabrication et refabrication sous contraintes environnementales. Une politique de contrôle environnemental de seuil dynamique est développée pour coordonner les activités de production tout en respectant les limites environnementales imposées. Cette stratégie intègre simultanément les coûts économiques et environnementaux tout en gérant la priorisation et la commutation entre machines selon l’état du système et les contraintes d’émissions GES. L’évaluation comparative révèle des gains substantiels par rapport aux politiques pertinentes de la littérature, tant en efficience économique qu’en conformité environnementale.

La seconde contribution explore le potentiel de l’apprentissage par renforcement pour piloter les systèmes de base M1P1 dans un environnement stochastique. L’algorithme d’optimisation de politique proximale (PPO) est déployé avec un réglage méthodique des paramètres d’apprentissage. La validation s’effectue progressivement, commençant par une configuration basique avant d’incorporer les exigences environnementales. La comparaison qualitative atteste de la pertinence des techniques d’IA et établit une base méthodologique pour des applications ultérieures plus sophistiquées.

La synthèse de ces travaux souligne la nécessité d’intégrer les préoccupations environnementales dans l’optimisation manufacturière et révèle la synergie entre méthodologies classiques et innovations technologiques. Ces développements offrent aux gestionnaires industriels des instruments performants pour harmoniser les objectifs économiques et écologiques tout en maîtrisant les aléas opérationnels.

Titre traduit

Advanced control strategies for production systems under environmental constraints: integrated policies and reinforcement learning

Résumé traduit

This research develops and validates control strategies for unreliable manufacturing systems operating under environmental constraints. The proposed approach combines two distinct methodologies: dynamic stochastic programming combined with numerical approach for hybrid configurations, and artificial intelligence through reinforcement learning for simple systems.

The first contribution focuses on controlling hybrid production systems integrating manufacturing and remanufacturing under environmental constraints. A dynamic environmental hedging point (DEHPP) control policy is developed to coordinate production activities while respecting imposed environmental limits. This strategy simultaneously integrates economic and environmental costs while managing prioritization and switching between machines according to system state and GHG emission constraints. Comparative study reveals substantial gains compared to relevant policies from literature, both in economic efficiency and environmental compliance.

The second contribution explores the potential of reinforcement learning to control basic M1P1 systems in a stochastic environment. The Proximal Policy Optimization (PPO) algorithm is deployed with methodical tuning of learning parameters. Validation is conducted progressively, starting with a basic configuration before incorporating environmental requirements. Qualitative comparison demonstrates the relevance of AI techniques and establishes a methodological foundation for more sophisticated future applications.

The synthesis of this work emphasizes the necessity of integrating environmental concerns into manufacturing optimization and reveals the synergy between classical methodologies and technological innovations. These developments offer industrial managers powerful instruments to harmonize economic and ecological objectives while mastering operational uncertainties.

Type de document: Mémoire ou thèse (Mémoire de maîtrise électronique)
Renseignements supplémentaires: "Mémoire présentée à l'École de technologie supérieure comme exigence partielle à l'obtention de la maîtrise avec mémoire en génie de la production automatisée". Comprend des références bibliographiques (pages 105-109).
Mots-clés libres: programmation dynamique stochastique, apprentissage par renforcement, systèmes de production hybrides, émissions des GES, approche numérique
Directeur de mémoire/thèse:
Directeur de mémoire/thèse
Ouhimmou, Mustapha
Codirecteur:
Codirecteur
Gharbi, Ali
Programme: Maîtrise en ingénierie > Génie de la production automatisée
Date de dépôt: 25 févr. 2026 20:26
Dernière modification: 25 févr. 2026 20:26
URI: https://espace.etsmtl.ca/id/eprint/3800

Gestion Actions (Identification requise)

Dernière vérification avant le dépôt Dernière vérification avant le dépôt