Ndzie Enama, Laurent Davy (2026). Application du Machine Learning à la prédiction des paramètres optimaux des politiques de production d’un système manufacturier soumis à une demande périodique. Mémoire de maîtrise électronique, Montréal, École de technologie supérieure.
Prévisualisation |
PDF
Télécharger (2MB) | Prévisualisation |
Résumé
Les systèmes de production soumis à une demande variable et à des pannes et réparations aléatoires posent un défi majeur de pilotage, car les décisions optimales doivent s’adapter à une dynamique incertaine et non stationnaire. La programmation dynamique stochastique et les équations d’Hamilton–Jacobi–Bellman (HJB) constituent un outil rigoureux pour la détermination des politiques optimales de production. Toutefois, dans des contextes non stationnaires, la résolution numérique de ces équations nécessite un temps de calcul important, ce qui rend difficile l’exploration de multiples scénarios dans un contexte industriel où la réactivité est essentielle.
Ce mémoire propose de recourir à l’apprentissage automatique (Machine Learning) pour prédire rapidement les paramètres des politiques de production optimales, à partir de solutions d’HJB préalablement calculées. Les solutions obtenues par résolution des équations d’Hamil ton–Jacobi–Bellman servent de base de données pour entraîner des modèles d’apprentissage supervisé, qui apprennent la relation entre des paramètres du système et les caractéristique des politiques optimales. Une fois entraînés, ces modèles fournissent directement une approximation des paramètres optimaux, sans nécessiter de nouvelle résolution numérique des équations d’HJB, ce qui réduit considérablement le temps de calcul. Pour mettre en place et valider cette approche, une méthodologie progressive est développée sur deux systèmes de complexité différente, le second représentant une extension plus du premier.
Dans le cas d’un système constitué d’une machine produisant un type de pièce, plusieurs algorithmes sont comparés : l’algorithme des k-plus proches voisins (kNN), les réseaux de neurones profonds (DNN) et les réseaux de neurones à base radiale (RBF). L’espace d’entrée comprend d’abord les caractéristiques de la demande (moyenne, amplitude, fréquence), puis est étendu pour intégrer le coût de rupture de stock et le taux de réparation. Les résultats montrent que le kNN offre un excellent compromis entre précision et rapidité, reproduisant fidèlement les solutions issues des équations d’HJB tout en réduisant significativement le temps de calcul. Cela rend possible l’exploration rapide de plusieurs scénarios, permettant au décideur d’évaluer l’impact de différentes conditions opérationnelles sur la politique de production.
Pour valider la pertinence de cette approche sur un système plus complexe, l’étude est étendue à une machine produisant deux types de pièces. Cette configuration permet également d’analyser comment l’augmentation du nombre de variables d’entrée influence le choix de l’algorithme. Les résultats révèlent que le kNN devient moins performant lorsque la dimension de l’espace d’entrée augmente, tandis que les réseaux de neurones profonds maintiennent une bonne précision. Ces travaux confirment que l’apprentissage automatique constitue une alternative efficace aux résolutions répétées des équations d’HJB, permettant des prédictions quasi instantanées tout en guidant le choix de l’algorithme selon la complexité du système étudié.
Titre traduit
Prediction of optimal production policy parameters in manufacturing systems under periodic demand
Résumé traduit
Production systems subject to time-varying demand as well as random breakdowns and repairs pose a major control challenge, as optimal decisions must adapt to uncertain and non-stationary dynamics. Stochastic dynamic programming and Hamilton–Jacobi–Bellman (HJB) equations provide a rigorous framework for determining optimal production policies. However, in non stationary settings, the numerical resolution of these equations entails significant computational effort, which makes the exploration of multiple scenarios difficult in industrial environments where responsiveness is essential.
This thesis proposes the use of Machine Learning to rapidly predict the parameters of optimal production policies based on previously computed HJB solutions. The solutions obtained from the resolution of the Hamilton–Jacobi–Bellman equations are used to build a training dataset for supervised learning models, which learn the relationship between system parameters and the characteristics of optimal policies. Once trained, these models directly provide approximations of the optimal parameters without requiring further numerical resolution of the HJB equations, thereby significantly reducing computation time. To implement and validate this approach, a progressive methodology is developed on two systems of different complexity, the second representing an extension of the first.
In the case of a system consisting of a single machine producing one type of part, several algorithms are compared : the k-nearest neighbors (kNN) algorithm, deep neural networks (DNN), and radial basis function (RBF) neural networks. The input space initially includes demand characteristics (mean, amplitude, and frequency) and is subsequently extended to incorporate the backlog cost and the repair rate. The results show that kNN offers an excellent trade-off between accuracy and computational efficiency, closely reproducing the solutions obtained from the HJB equations while significantly reducing computation time. This enables rapid exploration of multiple scenarios, allowing decision-makers to assess the impact of different operating conditions on the production policy.
To assess the relevance of this approach on a more complex system, the study is extended to a machine producing two types of parts. This configuration also makes it possible to analyze how the increase in the number of input variables influences the choice of the learning algorithm. The results reveal that kNN performance deteriorates as the dimensionality of the input space increases, whereas deep neural networks maintain good predictive accuracy. These findings confirm that Machine Learning constitutes an effective alternative to repeated numerical solutions of the HJB equations, enabling near-instantaneous predictions while guiding the choice of the most suitable algorithm according to the complexity of the system under study.
| Type de document: | Mémoire ou thèse (Mémoire de maîtrise électronique) |
|---|---|
| Renseignements supplémentaires: | "Mémoire présenté à l'École de technologie supérieure comme exigence partielle à l'obtention de la maîtrise en génie de la production automatisée". Comprend des références bibliographiques (pages 145-155). |
| Mots-clés libres: | commande optimale, demande périodique, Machine Learning, systèmes manufacturiers, k-plus proches voisins, réseaux de neurones |
| Directeur de mémoire/thèse: | Directeur(-trice) Kenné, Jean-Pierre |
| Codirecteur: | Codirecteur(-trice) de mémoire/thèse Gharbi, Ali |
| Programme: | Maîtrise en ingénierie > Génie de la production automatisée |
| Date de dépôt: | 15 avr. 2026 17:10 |
| Dernière modification: | 15 avr. 2026 17:10 |
| URI: | https://espace.etsmtl.ca/id/eprint/3870 |
Gestion Actions (Identification requise)
![]() |
Dernière vérification avant le dépôt |

Statistiques de téléchargement
Statistiques de téléchargement