Optimized federated learning framework for Open Radio Access Networks (O-RAN)

Statistiques de téléchargement

Téléchargements

Téléchargements par mois depuis la dernière année

Singh, Amardip Kumar (2025). Optimized federated learning framework for Open Radio Access Networks (O-RAN). Thèse de doctorat électronique, Montréal, École de technologie supérieure.

Prévisualisation

PDF
Télécharger (5MB) | Prévisualisation

Résumé

The Open Radio Access Network (O-RAN) architecture represents a transformative paradigm for realizing the grand vision of beyond fifth-generation (B5G) and sixth-generation (6G) mobile networks. Through its foundational characteristics of disaggregation, standardized open interfaces enabling genuine multi-vendor interoperability, and embedded intelligence via RAN Intelligent Controllers (RICs), O-RAN enables unprecedented network capabilities. The programmable nature of O-RAN, particularly through the Non-Real-Time RIC (Non-RT-RIC) for strategic optimization and Near-Real-Time RIC (Near-RT-RIC) for tactical resource management, creates a platform where artificial intelligence and machine learning (ML) can revolutionize network operations. Through these advancements, O-RAN enables the vision of mobile networks simultaneously supporting heterogeneous service requirements such as enhanced Mobile Broadband (eMBB), ultra-Reliable Low-Latency Communications (uRLLC), and massive Machine-Type Communications (mMTC).

Realizing O-RAN’s embedded intelligence based use-cases critically depends on the ML model training framework itself. Federated Learning (FL), a distributed machine learning paradigm enabling collaborative model training across disaggregated network nodes without centralizing raw data, emerges as a promising solution. Unlike centralized learning, FL is uniquely suited for O-RAN’s multi-vendor, privacy-sensitive environment where: operational data cannot be shared across vendor boundaries due to confidentiality and competitive concerns; massive data volumes from millions of user equipment and thousands of base stations create prohibitive communication bottlenecks if transmitted to central servers; and regulatory frameworks like GDPR mandate data localization. FL enables critical O-RAN use cases including distributed anomaly detection across multi-vendor equipment for security, collaborative spectrum optimization without exposing proprietary algorithms, privacy-preserving quality-of-experience prediction using sensitive subscriber data, and real-time radio resource management leveraging localized channel state information that would be stale if centrally processed.

However, deploying FL in O-RAN environments presents formidable technical challenges fundamentally distinct from traditional federated learning scenarios. O-RAN’s strict control loop timing requirements makes learning time equally critical as model accuracy. Severe resource constraints exist at multiple layers: Distributed Unit (O-DU) and Radio Unit (O-RU) have limited computational capacity as edge nodes; Near-RT-RICs operate on resource-constrained servers; and backhaul links connecting these components have time-varying, bandwidth-limited connectivity. Moreover, the mobile devices participating in FL training are frequently handed over between O-DUs, causing lost computations, unpredictable changes in the participant set, and aggregation delays from straggler nodes. Production O-RAN deployments also demand concurrent execution of multiple FL tasks where each task potentially serving different network slices (eMBB, uRLLC, mMTC) with conflicting objectives and quality-of-service requirements while competing for shared infrastructure resources for the model training. Together, it poses three main challenges. The trained FL model must be (i) efficient to handle diverse system capabilities including heterogeneous compute power and varying channel conditions; (ii) robust to ensure global model performance under optimized aggregation algorithms; and (iii) reliable to converge within the defined thresholds.

This thesis systematically addresses these challenges through three progressive contributions. First, we develop a unified resource-efficient and communication-efficient FL framework that jointly solves trainer selection and resource allocation while attacking the communication bottleneck through synergistic integration of momentum-based acceleration and aggressive compression techniques. Second, we propose MHORANFed, a mobility-aware Hierarchical Federated Learning framework that explicitly handles inter-O-DU handover disruptions through hierarchical aggregation mapping to O-RAN’s architecture, adaptive resource reallocation for mobile participants, and dynamic aggregation weight adjustment. Third, we present the O-FL rApp, a system-level orchestration framework operating in the Non-RT-RIC that manages the complete lifecycle of multiple concurrent Federated Multi-Agent Reinforcement Learning tasks through strategic task and slice assignment, tactical resource reallocation among competing tasks.

Unlike prior works focusing on individual aspects in isolation or idealized settings, our integrated solution demonstrates practical, production-grade deployment feasibility through rigorous theoretical analysis, extensive experimental validation using benchmark FL datasets, realistic O-RAN testbeds with 3GPP-compliant channel models and 5G traffic traces, aligned with O-RAN Alliance specifications. This research establishes foundational principles and operational frameworks enabling autonomous, adaptive, privacy-preserving federated learning framework at scale which are essential building blocks for realizing the full potential of intelligent O-RAN in B5G evolution and 6G networks.

Titre traduit

Cadre d’apprentissage fédéré optimisé pour les réseaux d’accès radio ouverts (O-RAN)

Résumé traduit

L’architecture Open Radio Access Network (O-RAN) représente un paradigme transformateur pour la réalisation de la vision ambitieuse des réseaux mobiles au-delà de la cinquième génération (B5G) et de la sixième génération (6G). Grâce à ses caractéristiques fondamentales de désagrégation, d’interfaces ouvertes standardisées permettant une véritable interopérabilité multi-fournisseurs, et d’intelligence intégrée via les contrôleurs intelligents du RAN (RICs), O-RAN permet des capacités réseau sans précédent. La nature programmable d’O-RAN, en particulier via le RIC non temps réel (Non-RT-RIC) pour l’optimisation stratégique et le RIC quasi temps réel (Near-RT-RIC) pour la gestion tactique des ressources, crée une plateforme où l’intelligence artificielle et l’apprentissage automatique (ML) peuvent révolutionner les opérations réseau. À travers ces avancées, O-RAN permet la vision de réseaux mobiles supportant simultanément des exigences de services hétérogènes telles que l’amélioration de la bande large mobile (eMBB), les communications ultra-fiables et de très faible latence (uRLLC), et les communications massives de type machine (mMTC).

La réalisation des cas d’usage basés sur l’intelligence intégrée d’O-RAN dépend de manière critique du cadre de formation des modèles ML lui-même. L’apprentissage fédéré (FL), un paradigme d’apprentissage automatique distribué permettant la formation collaborative de modèles à travers des nœuds réseau désagrégés sans centraliser les données brutes, émerge comme une solution prometteuse. Contrairement à l’apprentissage centralisé, FL est particulièrement adapté à l’environnement multi-fournisseurs d’O-RAN sensible à la confidentialité où : les données opérationnelles ne peuvent pas être partagées au-delà des frontières des fournisseurs en raison de préoccupations concernant la confidentialité et la concurrence ; les volumes massifs de données provenant de millions d’équipements utilisateur et de milliers de stations de base créent des goulets d’étranglement de communication prohibitifs s’ils sont transmis à des serveurs centraux ; et les cadres réglementaires comme le RGPD mandatent la localisation des données. FL permet des cas d’usage critiques d’O-RAN incluant la détection d’anomalies distribuée across les équipements multi-fournisseurs pour la sécurité, l’optimisation collaborative du spectre sans exposer les algorithmes propriétaires, la prédiction de qualité d’expérience préservant la vie privée en utilisant des données d’abonné sensibles, et la gestion en temps réel des ressources radio exploitant les informations d’état de canal localisées qui seraient obsolètes si traitées de manière centralisée.

Cependant, le déploiement de FL dans les environnements O-RAN présente des défis techniques formidables fondamentalement distincts des scénarios d’apprentissage fédéré traditionnels. Les exigences strictes de synchronisation des boucles de contrôle d’O-RAN rendent le temps d’apprentissage tout aussi critique que la précision du modèle. Des contraintes de ressources sévères existent à plusieurs niveaux : l’unité distribuée (O-DU) et l’unité radio (O-RU) disposent d’une capacité de calcul limitée en tant que nœuds périphériques ; les Near-RT-RICs fonctionnent sur des serveurs aux ressources limitées ; et les liaisons de backhaul reliant ces composants présentent une connectivité variable et limitée en bande passante. De plus, les appareils mobiles participant à la formation FL sont fréquemment remis entre les O-DU, causant la perte de calculs, des changements imprévisibles de l’ensemble des participants, et des délais d’agrégation causés par les nœuds traînards. Les déploiements O-RAN en production exigent également l’exécution simultanée de multiples tâches FL où chaque tâche servant potentiellement différentes tranches réseau (eMBB, uRLLC, mMTC) avec des objectifs conflictuels et des exigences de qualité de service tout en concurrençant pour les ressources d’infrastructure partagée pour la formation du modèle. Ensemble, cela pose trois défis principaux. Le modèle FL entraîné doit être (i) efficace pour gérer des capacités système diverses incluant une puissance de calcul hétérogène et des conditions de canal variables ; (ii) robuste pour assurer la performance du modèle global selon des algorithmes d’agrégation optimisés ; et (iii) fiable pour converger dans les seuils définis.

Cette thèse aborde systématiquement ces défis à travers trois contributions progressives. Pre mièrement, nous développons un cadre FL efficace en ressources et en communication unifié qui résout conjointement la sélection de formateurs et l’allocation de ressources tout en at taquant le goulet d’étranglement de communication par l’intégration synergique de techniques d’accélération basée sur le momentum et de techniques de compression agressive. Deuxième ment, nous proposons MHORANFed, un cadre d’apprentissage fédéré hiérarchique tenant compte de la mobilité qui traite explicitement les perturbations de passation inter-O-DU par le biais de l’agrégation hiérarchique mappée à l’architecture d’O-RAN, la réallocation adaptative des ressources pour les participants mobiles, et l’ajustement dynamique du poids d’agrégation. Troisièmement, nous présentons l’application O-FL rApp, un cadre d’orchestration au niveau système fonctionnant dans le Non-RT-RIC qui gère le cycle de vie complet de multiples tâches d’apprentissage par renforcement multi-agents fédérés concurrentes par l’assignation stratégique de tâches et de tranches, la réallocation tactique des ressources parmi les tâches concurrentes.

Contrairement aux travaux antérieurs se concentrant sur des aspects individuels isolément ou dans des contextes idéalisés, notre solution intégrée démontre la faisabilité du déploiement de qualité production à travers une analyse théorique rigoureuse, une validation expérimentale extensive utilisant des ensembles de données FL de référence, des testbeds O-RAN réalistes avec des modèles de canal conformes à la 3GPP et des traces de trafic 5G, alignés avec les spécifications de l’O-RAN Alliance. Cette recherche établit les principes fondamentaux et les cadres opérationnels permettant un cadre d’apprentissage fédéré autonome, adaptatif, préservant la vie privée à l’échelle qui sont des éléments constitutifs essentiels pour réaliser le plein potentiel d’O-RAN intelligent dans l’évolution B5G et les réseaux 6G.

Type de document:	Mémoire ou thèse (Thèse de doctorat électronique)
Renseignements supplémentaires:	"Thesis presented to École de technologie supérieure in partial fulfillment for the degree of Doctor of Philosophy". Comprend des références bibliographiques (pages 189-199).
Mots-clés libres:	apprentissage fédéré, open RAN, O-RAN, contrôleur intelligent RAN, optimisation des ressources, efficacité de communication, compression de gradient, apprentissage hiérarchique, qualité de service, B5G, 6G, découpage de réseau, IA préservant la confidentialité
Directeur de mémoire/thèse:	Directeur de mémoire/thèse Nguyen, Kim Khoa
Programme:	Doctorat en génie > Génie
Date de dépôt:	04 mars 2026 15:48
Dernière modification:	04 mars 2026 15:48
URI:	https://espace.etsmtl.ca/id/eprint/3808

Gestion Actions (Identification requise)

Dernière vérification avant le dépôt