La vitrine de diffusion des mémoires et thèses de l'ÉTS
RECHERCHER

Identification automatisée de marques descriptives sur des images de douilles de cartouche

Téléchargements

Téléchargements par mois depuis la dernière année

Le Bouthillier, Marie-Eve (2025). Identification automatisée de marques descriptives sur des images de douilles de cartouche. Thèse de doctorat électronique, Montréal, École de technologie supérieure.

[thumbnail of Le Bouthillier_Marie-Eve.pdf]
Prévisualisation
PDF
Télécharger (113MB) | Prévisualisation

Résumé

Les scènes de crimes impliquant des armes à feu doivent être analysées attentivement en vue de présenter un ensemble de preuves lors d'un procès. Il s'avère utile pour les enquêtes de pouvoir associer une arme à feu avec une scène de crime. Lors du tir d’une cartouche, les mécanismes de l’arme à feu laissent des marques descriptives sur la balle et la douille. Lorsque des douilles sont retrouvées sur une scène de crime, ces marques sont analysées dans un laboratoire. Ces marques peuvent être des caractéristiques de classe, qui sont communes aux armes à feu d’une même famille; ou des caractéristiques individuelles, qui sont théoriquement uniques et permettent de relier un spécimen à une arme à feu précise. Avant de comparer les caractéristiques individuelles pour proposer des correspondances, un triage manuel est généralement effectué en considérant les caractéristiques de classe, afin d’éviter de calculer inutilement les comparaisons avec des spécimens produits par des familles d’armes différentes. Une analyse automatique permettrait d'assister les techniciens lors de la saisie de l’information, en suggérant les catégories présentes.

L'objectif principal de cette thèse est de déterminer une méthode d’apprentissage machine permettant d’identifier des marques microscopiques présentes sur des images de douilles de cartouche. La première contribution consiste à classifier les marques selon sept catégories: parallèle, arche, hachure, circulaire, granulaire, lisse et inconnu. Nous avons entraîné et évalué des modèles multiclasses, multiétiquettes, et binaires. L’évaluation du modèle multiétiquette ENB3 sans augmentation présente une mesure F1 de 54,47%, et une perte de 0,36. Les évaluations des modèles binaires sans augmentation présentent des valeurs entre 70,00% et 93,00% pour la mesure F1, et des valeurs entre 0,22 et 2,01 pour la fonction de perte. Lors de ces expérimentations, nous avons remarqué des incohérences dans les étiquettes de la vérité de terrain et nous suggérons un ré-étiquetage des données.

La seconde contribution consiste à évaluer des regroupements d’images de douilles. Ces regroupements ont été créés par des algorithmes traditionnels et un réseau profond de clustering, à partir des caractéristiques descriptives des images extraites par les réseaux entraînés à l’objectif précédent. Nous avons observé que les algorithmes favorisant la création de clusters de formes et de tailles variées semblent mieux adaptés à nos données, et nous avons apprécié la technique de clustering flou, qui calcule un degré d’appartenance des points à chaque groupe. Nous suggérons des travaux futurs combinant ces deux approches.

La dernière contribution étudie l’accord interobservateur entre six observateurs humains et les méthodes d’apprentissage profond supervisé. Nous avons observé des coefficients Kappa moyens variant de faibles pour les catégories granulaire et lisse, à élevés pour la catégorie circulaire. Nous avons ensuite construit un ensemble de vérité de terrain de 1000 échantillons vérifié par deux experts. Nous avons repris les expérimentations multiétiquettes avec cet ensemble, sans augmentation. Nous avons observé une amélioration, avec une courbe d’entraînement atteignant 90,00% d’exactitude. Lors de l’évaluation, nous avons observé une amélioration de la moyenne pondérée pour la mesure F1 à 77,12%. Nous croyons que ce modèle démontre de meilleures capacités pour la classification des images de douilles et nous suggérons d’améliorer l’ensemble de vérité de terrain en ajoutant des échantillons supplémentaires, particulièrement dans les catégories plus rares.

En dernière analyse, il ressort de cette thèse que l’apprentissage profond pourrait être utilisé afin d’identifier automatiquement des marques descriptives sur des images de douilles de cartouche. Éventuellement, des modèles de classification pourraient être inclus dans des systèmes d’identification automatisée. En plus d’améliorer les performances des algorithmes de comparaison en réduisant les temps de calcul, ils pourraient fournir de l’information aux enquêteurs promptement, ce qui pourrait permettre de faire avancer les enquêtes en cours plus rapidement. Les modèles devront toutefois être améliorés afin d’inclure les catégories plus rares, ainsi que certaines exceptions (telles que des marques produites à d’autres moments que lors de l’utilisation de l’arme). Nous recommandons de poursuivre la recherche avec les classificateurs binaires tout en augmentant l’ensemble de vérité de terrain vérifié.

Titre traduit

Automated identification of descriptive marks on images of cartridge cases

Résumé traduit

Crime scenes involving firearms need to be carefully analyzed to present a body of evidence at trial. It is useful for investigations to be able to associate a firearm with a crime scene. When a cartridge is fired, the mechanisms of the firearm leave descriptive marks on the bullet and the cartridge case, and when cartridge cases are found at a crime scene, these marks are analyzed in a laboratory. These marks may be class characteristics, which are common to firearms in the same family; or individual characteristics, which are theoretically unique and enable a specimen to be linked to a specific firearm. Before individual characteristics are compared to propose matches, manual sorting is generally carried out by considering class characteristics, to avoid unnecessary calculation of comparisons with specimens produced by different gun families. An automatic analysis would assist technicians when entering information, by suggesting the categories present.

The main objective of this thesis is to determine a machine learning method for identifying microscopic marks present in images of cartridge cases. The first contribution consists in classifying the marks according to seven categories: parallel, arch, crosshatch, circular, granular, smooth and unknown. We trained and evaluated multiclass, multilabel and binary models. Evaluation of the ENB3 multilabel model without augmentation shows an F1 measure of 54.47%, and a loss of 0.36. The evaluations of the binary models without augmentation show values between 70.00% and 93.00% for the F1 measure, and values between 0.22 and 2.01 for the loss function. During these experiments, we noticed inconsistencies in the ground-truth labels and suggest relabelling the data.

The second contribution consists in evaluating clusters of cartridge case images. These clusters were created by traditional algorithms and a deep clustering network, based on the descriptive features of the images extracted by the networks trained in the previous objective. We observed that algorithms favouring the creation of clusters of various shapes and sizes seemed better suited to our data, and we appreciated the fuzzy clustering technique, which calculates a degree of membership of points to each group. We suggest future work combining these two approaches.

The final contribution study inter-observer agreement between six human observers and supervised deep learning methods. We observed average Kappa coefficients ranging from low for the granular and smooth categories, to high for the circular category. We subsequently built a ground truth set of 1,000 samples verified by two experts. We repeated the multilabel experiment with this set, without data augmentation. We observed an improvement, with a training curve reaching 90.00% accuracy. In the evaluation, we observed an improvement in the weighted average for the F1 measure to 77.12%. We believe that this model demonstrates better capabilities for the classification of cartridge case images, and we suggest improving the ground truth set by adding additional samples, particularly those in the more uncommon categories.

In summary, this thesis shows that deep learning could be used to automatically identify descriptive marks on images of cartridge cases. Eventually, classification models could be included in automated identification systems. As well as improving the performance of matching algorithms by reducing computation times, they could provide information to investigators promptly, which could help to advance ongoing investigations faster. The models will, however, need to be improved to include rarer categories, as well as certain exceptions (such as marks produced at times other than when the weapon was being used). We recommend continuing research with binary classifiers while increasing the verified ground truth set.

Type de document: Mémoire ou thèse (Thèse de doctorat électronique)
Renseignements supplémentaires: "Thèse présentée à l’École de technologie supérieure comme exigence partielle à l’obtention du doctorat en génie". Comprend des références bibliographiques (pages 239-245).
Mots-clés libres: apprentissage profond, multiétiquette, classification, regroupement, clustering, défauts de surface
Directeur de mémoire/thèse:
Directeur de mémoire/thèse
Duong, Luc
Codirecteur:
Codirecteur
Ratté, Sylvie
Programme: Doctorat en génie > Génie
Date de dépôt: 17 nov. 2025 15:52
Dernière modification: 08 déc. 2025 20:22
URI: https://espace.etsmtl.ca/id/eprint/3744

Gestion Actions (Identification requise)

Dernière vérification avant le dépôt Dernière vérification avant le dépôt