Le, Van Hau (2023). Protecting tactical wireless networks against dual interception. Mémoire de maîtrise électronique, Montréal, École de technologie supérieure.
Prévisualisation |
PDF
Télécharger (1MB) | Prévisualisation |
Résumé
Today, wireless tactical networks are constantly being upgraded to become more networkcentric and autonomous. The unprecedented development of artificial intelligence (AI) paves the way for the non-human involved military applications in which soldiers can be replaced by autonomous combat vehicles that are fully equipped with combat weapons as well as a powerful communication ability for tactical cooperation on the battlefield. However, increasing communication connectivity combined with decreasing human intervention makes the security and reliability of the system become riskier. A larger number of connections requires very scalable resource management, and the system is more vulnerable to electronic interception by the enemy. Thus, a self-defensive capability is required in these tactical systems to protect them against the enemy’s interception.
This thesis investigates the problem of protecting high-mobility tactical networks against dual enemy interceptions. We design an anti-interception resource optimization strategy in which multiple system control variables are jointly optimized to not only protect the system from enemy interception but also maintain the quality of service (QoS). We apply the proposed strategy in two different tactical scenarios: i) a Warfighter Information Network-Tactical (WIN-T) system with the high mobility of ground combat vehicles (GCVs), and ii) a mixed radio frequency/freespace optical (RF/FSO) relay network where both the relay node and enemy interceptors are high-mobility objects.
In both scenarios, we mathematically formulate the anti-interception resource allocation problem as a non-convex optimization model. We decompose this intractable optimization problem into two sub-problems, then solve the first sub-problem using an iterative method. To handle the non-convex form of the second sub-problem, we combine first-order Taylor approximation with the difference of convex functions (D.C) method. To obtain the optimized solution in near real-time, we propose Deep Reinforcement Learning (DRL) approaches, using both single agent and multi-agent model. Numerical results show the DRL method has the potential to be applicable in high-complexity military scenarios.
To make a decision of selecting a DRL solution for a given dual anti-interception scenario, we compare the defensive capacity of two frameworks SADRL (Single-Agent Deep Reinforcement Learning) and MADRL (Multi-Agent Deep Reinforcement Learning) in different levels of mobility and user scalability. Numerical results show that both frameworks can approximate the optimal solution. However, in highly mobile and massive deployment scenarios, the defensive performance of MADRL performs better than that of SADRL but has a higher overhead cost.
Titre traduit
Protéger les réseaux tactiques sans fil contre la double Interception
Résumé traduit
Aujourd’hui, les réseaux tactiques sans fil sont constamment améliorés pour devenir plus autonomes. La croissance sans précédent de l’intelligence artificielle (IA) ouvre la voie pour des applications militaires sans intervention humaine, où les soldats seraient remplacés par des véhicules de combat autonomes entièrement équipés d’armes de combat ainsi que d’une capacité de communication élevée qui permet des coopérations tactiques sur le champ de bataille. Cependant, une connectivité croissante combinée avec une intervention humaine réduite rend le système plus vulnérable en termes de sécurité et de fiabilité. Un nombre croissant de connexions nécessite une gestion des ressources très évolutive, et le système est plus exposé aux interceptions électroniques de l’ennemi. Ainsi, l’amélioration de la capacité d’autodéfense de ces tactiques est nécessaire pour les protéger contre des interceptions de l’ennemi.
Cette thèse étudie le problème de protection des réseaux tactiques à haute mobilité contre les interceptions simultanées de l’ennemi. Nous concevons une stratégie d’optimisation des ressources pour l’anti interception dans laquelle plusieurs variables de contrôle du système sont optimisées conjointement pour non seulement protéger le système contre les interceptions ennemies, mais également maintenir une qualité de service (QoS) satisfaisante. Nous appliquons cette stratégie proposée dans deux scénarios tactiques différents : i) un réseau d’information de combattant-tactique (WIN-T) avec une mobilité élevée des véhicules de combat terrestres (GCVs), et ii) un réseau de relais mixte radiofréquence/optique en espace libre (RF/FSO) où le nœud de relais et les intercepteurs ennemis sont tous des objets hautement mobiles.
Dans ces deux scénarios, nous formulons mathématiquement le problème d’allocation des ressources pour l’anti interception sous la forme d’un modèle d’optimisation non-convexe. Nous décomposons ce problème d’optimisation complexe en deux sous-problèmes, puis résolvons le premier sous-problème à l’aide d’une méthode itérative. Pour traiter la forme non convexe du deuxième sous-problème, nous combinons l’approximation de Taylor du premier ordre avec la méthode des fonctions convexes différences (D.C). Pour obtenir la solution optimisée en temps quasi-réel, nous proposons des approches d’apprentissage par renforcement profond (DRL), en utilisant à la fois des modèles d’agent unique et d’agents multiples. Les résultats expérimentaux montrent que la méthode DRL a le potentiel d’être applicable dans des scénarios militaires de haute complexité.
Pour prendre la décision de sélectionner une solution DRL pour un scénario d’anti-interception double donné, nous comparons la capacité défensive de deux cadres : Apprentissage par renforcement profond à agent unique (SADRL) et apprentissage par renforcement profond multi-agent (MADRL) en différents niveaux de mobilité et de scalabilité des utilisateurs. Les résultats expérimentaux montrent que les deux cadres peuvent approcher la solution optimale. Cependant, dans les scénarios hautement mobiles et de déploiement massif, la performance défensive de MADRL est meilleure que celle de SADRL, mais la première demande un coût plus élevé en termes de ressources.
Type de document: | Mémoire ou thèse (Mémoire de maîtrise électronique) |
---|---|
Renseignements supplémentaires: | "Thesis presented to École de technologie supérieure in partial fulfillment of a master’s degree with thesis in telecommunication networks". Comprend des références bibliographiques (pages 91-101). |
Mots-clés libres: | faible probabilité d’interception, optimisation, apprentissage par renforcement profond multi-agent, réseau de relais mixte RF/FSO, double interception |
Directeur de mémoire/thèse: | Directeur de mémoire/thèse Nguyen, Kim Khoa |
Programme: | Maîtrise en ingénierie > Génie |
Date de dépôt: | 08 déc. 2023 17:06 |
Dernière modification: | 08 déc. 2023 17:06 |
URI: | https://espace.etsmtl.ca/id/eprint/3321 |
Gestion Actions (Identification requise)
Dernière vérification avant le dépôt |