La vitrine de diffusion des mémoires et thèses de l'ÉTS
RECHERCHER

Données synthétiques et vision par ordinateur : vers une reconnaissance robuste des actions en boxe

Téléchargements

Téléchargements par mois depuis la dernière année

Takouti, Yosr (2025). Données synthétiques et vision par ordinateur : vers une reconnaissance robuste des actions en boxe. Mémoire de maîtrise électronique, Montréal, École de technologie supérieure.

[thumbnail of TAKOUTI_Yosr-1.pdf]
Prévisualisation
PDF
Télécharger (33MB) | Prévisualisation

Résumé

L’analyse automatisée des performances en boxe soulève des défis scientifiques majeurs en raison du manque de jeux de données annotés de haute qualité, de la complexité des interactions corporelles, de la variabilité des postures et des effets d’occlusion dans les vidéos réelles. La collecte manuelle de telles annotations étant coûteuse, chronophage et sujette à l’erreur humaine, ce mémoire propose une approche alternative fondée sur la génération de données synthétiques. Nous concevons un pipeline complet et modulable permettant de simuler des scènes de boxe réalistes en 3D, en combinant des modèles corporels paramétriques (SMPL), des animations articulaires issues de captures de mouvement et des environnements procéduraux configurés selon plusieurs styles (salle d’entraînement, compétition olympique, Las Vegas, etc.). Ce pipeline intègre également une méthode d’annotation automatique multi-niveaux, enrichie par une annotation manuelle complémentaire et un processus de validation, pour capturer les actions, postures biomécaniques et résultats associés. Grâce à la diversité des caméras virtuelles, des conditions lumineuses et des morphologies corporelles simulées, notre jeu de données synthétique couvre un large éventail de configurations visuelles. Les résultats expérimentaux montrent que les modèles d’apprentissage profond entraînés sur ces données atteignent des performances compétitives en reconnaissance d’action et en estimation de posture, y compris dans des contextes réels. Cette approche ouvre des perspectives innovantes pour le développement de systèmes intelligents appliqués à l’analyse de performance en sports de combat et à la modélisation biomécanique assistée par l’intelligence artificielle.

Titre traduit

Synthetic data and computer vision : towards robust boxing action recognition

Résumé traduit

Automated boxing performance analysis presents significant challenges due to the scarcity of high-quality annotated datasets, the complexity of body-to-body interactions, the variability of postures, and frequent occlusions in real-world footage. Manual annotation is time-consuming, error-prone, and difficult to scale, motivating the use of synthetic data generation as an alternative. In this thesis, we present a modular and reproducible pipeline for creating photorealistic 3D boxing scenes, leveraging parametric human models (SMPL), motion capture-driven animations, and procedurally generated environments representing diverse contexts (e.g., training gym, Olympic competition, Las Vegas events). The pipeline incorporates a multi-level automatic annotation system, supported by manual verification, to capture detailed information on actions, biomechanical postures, and outcome categories. A dedicated web-based annotation tool offers synchronized multi-view playback, temporal segmentation, and hierarchical labeling. The rendering engine generates large-scale datasets with rich variations in camera angles, lighting conditions, and body morphologies, enabling robust training samples. Experimental evaluations demonstrate that deep learning models trained on these synthetic data achieve competitive accuracy in action recognition and pose estimation, even when applied to real footage. This work highlights the potential of synthetic datasets in advancing computer vision systems for combat sports performance analysis and AI-assisted biomechanical modeling.

Type de document: Mémoire ou thèse (Mémoire de maîtrise électronique)
Renseignements supplémentaires: "Mémoire présenté à l'École de technologie supérieure comme exigence partielle à l'obtention de la maîtrise en génie des technologies de l'information avec mémoire". Comprend des références bibliographiques (pages 127-130).
Mots-clés libres: infographie, animation de personnages, ensemble de données synthétiques, analyse de la boxe, classificateur ML
Directeur de mémoire/thèse:
Directeur de mémoire/thèse
Andrews, Sheldon
Codirecteur:
Codirecteur
Labbé, David
Programme: Maîtrise en ingénierie > Génie des technologies de l'information
Date de dépôt: 24 févr. 2026 18:28
Dernière modification: 24 févr. 2026 18:28
URI: https://espace.etsmtl.ca/id/eprint/3787

Gestion Actions (Identification requise)

Dernière vérification avant le dépôt Dernière vérification avant le dépôt