Farjallah, Rania (2025). 5G data generation for machine learning applications. Mémoire de maîtrise électronique, Montréal, École de technologie supérieure.
Prévisualisation |
PDF
Télécharger (3MB) | Prévisualisation |
Résumé
Fifth-generation mobile networks enable unprecedented throughput, ultra-low latency, and massive device connectivity, giving rise to traffic patterns that are highly dynamic and complex. Optimizing such networks increasingly relies on machine learning, yet effective models require large-scale, complete, and representative datasets. To address this challenge, this work relies on large-scale urban mobility datasets, chosen for their traffic patterns and temporal dynamics, which closely reflect those observed in 5G networks. However, these datasets often suffer from missing observations, which motivates the development of an adaptive imputation approach designed to reconstruct incomplete time series while preserving seasonal structures and temporal dependencies. To evaluate imputation quality where ground truth is unavailable, novel metrics are introduced, providing an alternative to traditional metrics and enabling a more robust and informative evaluation. After validation, the reconstructed urban datasets are transformed into preliminary 5G traffic traces, providing a structured foundation for further modeling and analysis. Building on this foundation, a principled traffic generation framework based on the Maximum Entropy Principle is proposed, which encodes empirically observed constraints to produce realistic synthetic data that accurately capture temporal dynamics and distributional properties. This approach is particularly effective in real-world scenarios where access to highquality 5G traffic data is limited due to privacy concerns, operational constraints, or incomplete measurements. By generating representative and statistically consistent synthetic data, the framework facilitates improved forecasting, anomaly detection, and network performance evaluation, enabling telecommunication operators and researchers to design, test, and optimize next-generation mobile systems more effectively. Extensive experiments confirm that the proposed framework improves data quality, supports realistic 5G traffic modeling, and enables more robust forecasting, anomaly detection, and network performance evaluation in nextgeneration mobile systems.
Titre traduit
Génération de données 5G pour les applications d’apprentissage automatique
Résumé traduit
Les réseaux mobiles de cinquième génération offrent des débits sans précédent, une latence extrêmement faible et une connectivité massive, donnant lieu à des schémas de trafic hautement dynamiques et complexes. L’optimisation de ces réseaux reposent de plus en plus sur l’apprentissage automatique, mais des modèles performants exigent des jeux de données à grande échelle, complets et représentatifs, qui sont rarement disponibles. Pour relever ce défi, ce travail s’appuie sur de vastes jeux de données issus de la mobilité urbaine, sélectionnés en raison de leurs schémas de trafic et de leurs dynamiques temporelles, qui reflètent étroitement ceux observés dans les réseaux 5G. Toutefois, ces jeux de données présentent souvent des observations manquantes, ce qui motive le développement d’une approche d’imputation adaptative, conçue pour reconstruire des séries temporelles incomplètes tout en préservant les structures saisonnières et les dépendances temporelles. Afin d’évaluer la qualité de l’imputation en l’absence des valeurs réelles, de nouvelles métriques sont proposées, ffrant une alternative aux métriques traditionnelles et permettant une évaluation plus robuste et plus informative. Après validation, les jeux de données urbains reconstruits sont transformés en traces préliminaires de trafic 5G, constituant une base structurée pour des analyses et modélisations ultérieures. Sur cette base, un cadre de génération de trafic, fondé sur le Principe de Maximum d’Entropie, est proposé ; il encode des contraintes empiriquement observées afin de produire des données synthétiques réalistes qui capturent fidèlement les dynamiques temporelles et les propriétés distributionnelles. Cette approche s’avère efficace dans des scénarios réels où l’accès à des données de trafic 5G de haute qualité est limité en raison de contraintes liées à la confidentialité, de restrictions opérationnelles ou de mesures incomplètes. En générant des données synthétiques représentatives et statistiquement cohérentes, le cadre proposé facilite l’amélioration des prévisions, la détection d’anomalies et l’évaluation des performances du réseau, permettant ainsi aux opérateurs de télécommunications et aux chercheurs de concevoir, tester et optimiser plus efficacement les systèmes mobiles de nouvelle génération. Des expériences approfondies démontrent que le cadre proposé améliore la qualité des données, favorise la modélisation réaliste du trafic 5G et permet des prévisions plus robustes, une meilleure détection des anomalies et une évaluation plus fiable des performances des réseaux de prochaine génération.
| Type de document: | Mémoire ou thèse (Mémoire de maîtrise électronique) |
|---|---|
| Renseignements supplémentaires: | "Manuscript-based thesis presented to École de technologie supérieure in partial fulfillment of a master’s degree with thesis in engineering with a personalized concentration". Comprend des références bibliographiques (pages 83-93). |
| Mots-clés libres: | génération de trafic 5G, imputation de séries temporelles, génération de données synthétiques, principe d’entropie maximale, divergence de Jensen–Shannon, distance de wasserstein, score discriminatif, timeGPT |
| Directeur de mémoire/thèse: | Directeur de mémoire/thèse Selim, Bassant |
| Codirecteur: | Codirecteur Kaddoum, Georges Jaumard, Brigitte |
| Programme: | Maîtrise en ingénierie > Génie |
| Date de dépôt: | 17 nov. 2025 15:12 |
| Dernière modification: | 17 nov. 2025 15:12 |
| URI: | https://espace.etsmtl.ca/id/eprint/3737 |
Gestion Actions (Identification requise)
![]() |
Dernière vérification avant le dépôt |

Statistiques de téléchargement
Statistiques de téléchargement