La vitrine de diffusion des mémoires et thèses de l'ÉTS
RECHERCHER

A dissimilarity representation approach to designing systems for signature verification and bio-cryptography

Ekladious, George S. Eskander (2014). A dissimilarity representation approach to designing systems for signature verification and bio-cryptography. Thèse de doctorat électronique, Montréal, École de technologie supérieure.

[img]
Prévisualisation
PDF
Télécharger (4MB) | Prévisualisation
[img]
Prévisualisation
PDF
Télécharger (882kB) | Prévisualisation

Résumé

Automation of legal and financial processes requires enforcing of authenticity, confidentiality, and integrity of the involved transactions. This Thesis focuses on developing offline signature verification (OLSV) systems for enforcing authenticity of transactions. In addition, bio-cryptography systems are developed based on the offline handwritten signature images for enforcing confidentiality and integrity of transactions.

Design of OLSV systems is challenging, as signatures are behavioral biometric traits that have intrinsic intra-personal variations and inter-personal similarities. Standard OLSV systems are designed in the feature representation (FR) space, where high-dimensional feature representations are needed to capture the invariance of the signature images. With the numerous users, found in real world applications, e.g., banking systems, decision boundaries in the high-dimensional FR spaces become complex. Accordingly, large number of training samples are required to design of complex classifiers, which is not practical in typical applications. In contrast, design of bio-cryptography systems based on the offline signature images is more challenging. In these systems, signature images lock the cryptographic keys, and a user retrieves his key by applying a query signature sample. For practical bio-cryptographic schemes, the locking feature vector should be concise. In addition, such schemes employ simple error correction decoders, and therefore no complex classification rules can be employed.

In this Thesis, the challenging problems of designing OLSV and bio-cryptography systems are addressed by employing the dissimilarity representation (DR) approach. Instead of designing classifiers in the feature space, the DR approach provides a classification space that is defined by some proximity measure. This way, a multi-class classification problem, with few samples per class, is transformed to a more tractable two-class problem with large number of training samples. Since many feature extraction techniques have already been proposed for OLSV applications, a DR approach based on FR is employed. In this case, proximity between two signatures is measured by applying a dissimilarity measure on their feature vectors. The main hypothesis of this Thesis is as follows. The FRs and dissimilarity measures should be properly designed, so that signatures belong to same writer are close, while signatures of different writers are well separated in the resulting DR spaces. In that case, more cost-effecitive classifiers, and therefore simpler OLSV and bio-cryptography systems can be designed.

To this end, in Chapter 2, an approach for optimizing FR-based DR spaces is proposed such that concise representations are discriminant, and simple classification thresholds are sufficient. High-dimensional feature representations are translated to an intermediate DR space, where pairwise feature distances are the space constituents. Then, a two-step boosting feature selection (BFS) algorithm is applied. The first step uses samples from a development database, and aims to produce a universal space of reduced dimensionality. The resulting universal space is further reduced and tuned for specific users through a second BFS step using user-specific training set. In the resulting space, feature variations are modeled and an adaptive dissimilarity measure is designed. This measure generates the final DR space, where discriminant prototypes are selected for enhanced representation. The OLSV and bio-cryptographic systems are formulated as simple threshold classifiers that operate in the designed DR space. Proof of concept simulations on the Brazilian signature database indicate the viability of the proposed approach. Concise DRs with few features and a single prototype are produced. Employing a simple threshold classifier, the DRs have shown state-of-the-art accuracy of about 7% AER, comparable to complex systems in the literature.

In Chapter 3, the OLSV problem is further studied. Although the aforementioned OLSV implementation has shown acceptable recognition accuracy, the resulting systems are not secure as signature templates must be stored for verification. For enhanced security, we modified the previous implementation as follows. The first BFS step is implemented as aforementioned, producing a writer-independent (WI) system. This enables starting system operation, even if users provide a single signature sample in the enrollment phase. However, the second BFS is modified to run in a FR space instead of a DR space, so that no signature templates are used for verification. To this end, the universal space is translated back to a FR space of reduced dimensionality, so that designing a writer-dependent (WD) system by the few user-specific samples is tractable in the reduced space. Simulation results on two real-world offline signature databases confirm the feasibility of the proposed approach. The initial universal (WI) verification mode showed comparable performance to that of state-of-the-art OLSV systems. The final secure WD verification mode showed enhanced accuracy with decreased computational complexity. Only a single compact classifier produced similar level of accuracy (AER of about 5.38 and 13.96% for the Brazilian and the GPDS signature databases, respectively) as complex WI and WD systems in the literature.

Finally, in Chapter 4, a key-binding bio-cryptographic scheme known as the fuzzy vault (FV) is implemented based on the offline signature images. The proposed DR-based two-step BFS technique is employed for selecting a compact and discriminant user-specific FR from a large number of feature extractions. This representation is used to generate the FV locking/unlocking points. Representation variability modeled in the DR space is considered for matching the unlocking and locking points during FV decoding. Proof of concept simulations on the Brazilian signature database have shown FV recognition accuracy of 3% AER and system entropy of about 45-bits. For enhanced security, an adaptive chaff generation method is proposed, where the modeled variability controls the chaff generation process. Similar recognition accuracy is reported, where more enhanced entropy of about 69-bits is achieved.

Titre traduit

Une approche basée sur les vecteurs de représentation par différences pour la conception des systèmes de vérification de signatures et de bio-cryptographie

Résumé traduit

L’automatisation des processus légaux et financiers exige des transactions sécuritaires qui assurent l’authenticité, la confidentialité et l’intégrité de l’information. Cette thèse porte sur le développement de systèmes de vérification hors-ligne des signatures manuscrites (SVSM) dans le but de rehausser la sécurité des transactions. De plus, un système de bio-cryptographie est également proposé afin d’assurer la confidentialité et l’intégrité des transactions.

La conception des systèmes de vérification de signatures manuscrites représente un défi important étant donné la grande variabilité intra-classe et des similarités interclasses importantes. Les méthodes traditionnelles reposent sur une représentation de l’image de la signature dans des espaces de caractéristiques de grande dimension afin de capturer les invariants dans l’image de la signature. Dans un contexte d’applications bancaires, le nombre d’usagers (classes) devient très important ce qui implique des frontières de décision complexes. De plus, une quantité importante de signatures sont requises pour l’apprentissage ce qui est impraticable pour les applications réelles. À l’opposé, la conception des systèmes de bio-cryptographie représente un défi encore plus grand. En effet, les images de signatures manuscrites servent pour bloquer les clés cryptographiques, conséquemment l’usager utilise sa propre signature comme requête afin de récupérer sa clé. Les systèmes de bio-cryptographie imposent comme contrainte un très petit nombre de caractéristiques discriminantes. Enfin ces systèmes utilisent un décodeur qui utilise un mécanisme très simple de correction d’erreur, ce qui implique l’utilisation de règles de classification très simples.

Dans cette thèse, la conception des systèmes de vérification de signatures et de bio-cryptographie est basée sur l’utilisation des espaces de différences (DR, dissimilarity representation). Contrairement à l’utilisation des espaces de mesures, les approches basées sur les vecteurs de différences reposent sur la notion de mesure de proximité. Conséquemment, un problème de classification avec un grand nombre de classes devient un problème à deux classes dans l’espace des différences. Un avantage important est que le nombre de références devient très important avec une formulation dans l’espace des différences. Étant donné qu’un nombre important de caractéristiques est déjà disponible alors les espaces basées sur les différences sont faciles à construire. L’hypothèse formulée dans cette thèse est que les signatures d’un même scripteur sont semblables dans l’espace des caractéristiques ce qui se traduit par une projection proche de l’origine dans l’espace des différences. Conséquemment, les signatures de scripteurs différents sont projetées très loin de l’origine. Cette formulation du problème de vérification permet l’utilisation de classificateurs très simples basés sur des seuils de décision ce qui permet également la conception des systèmes de bio-cryptographie performants.

Le Chapitre 2 présente une approche pour l’optimisation des espaces DR qui permet une réduction importante de la dimensionnalité. Ces espaces optimisés sont également très discriminants ce qui permet l’utilisation de classificateurs très simples. Des espaces de caractéristiques de grande dimension sont transformés dans un espace intermédiaire composé d’un vecteur de différences mesurées deux à deux. Ensuite, une sélection de caractéristiques est effectuée en deux étapes par un algorithme de type Gentle Adaboost. La première étape consiste à définir un espace de représentation universel à partir d’une base de développement. Ensuite, une deuxième étape consiste à spécialiser l’espace de représentation pour chaque abonné au système de vérification. De plus, la représentation finale comprend une phase où la variabilité intra-classe est modélisée dans l’espace des différences et les prototypes les plus discriminants sont sélectionnés. Une contribution importante de l’approche proposée est que la conception des systèmes de bio-cryptographie et de vérification de signatures sont formulée de la même façon ce qui permet l’utilisation de simples classificateurs basés sur des seuils de décision dans l’espace des différences. Une preuve de concept est réalisée à partir de la base de signatures brésiliennes (PUCPR). Il résulte des espaces de représentation de très faible dimension (environ 20 caractéristiques) ce qui permet l’utilisation d’un seul prototype de référence par scripteur. Un taux d’erreur moyen de 7% est obtenu avec ce système, ce qui est compétitif avec les approches beaucoup plus complexes publiées dans la littérature.

Au chapitre 3, le problème de la conception des systèmes de vérification de signatures dans les espaces de différences est approfondi. La première version du système était performante, mais pas suffisamment sécuritaire. En effet, les prototypes de référence sont conservés en mémoire ce qui favorise une utilisation frauduleuse du système. Conséquemment, une nouvelle approche pour la conception de classificateurs dépendent du scripteur est proposée. Brièvement, la deuxième étape de traitement permet de revenir dans un espace de caractéristiques réduit ce qui favorise l’apprentissage d’un classificateur dans l’espace des mesures pour chaque scripteur. En conséquence, seul un classificateur est conservé en mémoire ce qui diminue les risques de fraudes pour les systèmes de vérification de signatures. Les résultats expérimentaux obtenus sur deux bases de signatures sont comparables à ceux publiés dans la littérature pour un classificateur beaucoup plus simple. Les performances moyennes obtenues sont de 5.38% et de 13.96% respectivement pour les bases PUCPR et GPDS.

Finalement, une première approche fonctionnelle et performance d’un système de bio-cryptographie basé sur les images de signatures manuscrites est présentée au Chapitre 4. Une méthode d’encapsulage de la clé cryptographique basée sur le Fuzzy Vault (FV) est détaillée dans ce chapitre. L’étape la plus importante et la plus innovante est la sélection de caractéristiques stables, discriminantes et adaptées pour le FV. La méthode de sélection de caractéristiques en deux étapes basée sur la représentation par différences et présentée au Chapitre 2 est reprise et adaptée pour la conception de systèmes de bio-cryptographie. De plus, une méthode originale pour la génération de points fantômes (chaff points) basée sur une mesure de variabilité dans l’espace des différences est également exposée. Une preuve de concept sur la base PUCPR montre un taux d’erreur moyen de 3% pour une valeur d’entropie de 45 bits. La méthode de génération de chaff points adaptative permet d’augmenter l’entropie du système à 69 bits avec la même performance.

Type de document: Mémoire ou thèse (Thèse de doctorat électronique)
Renseignements supplémentaires: "Manuscript-based thesis presented to École de technologie supérieure in partial fulfillment of the requirements for the degree of doctor of philosophy" Bibliographie : pages 173-180.
Mots-clés libres: Signatures Informatique. Graphologie Informatique. Écriture Identification Informatique. Identification biométrique. bio-cryptographie, représentations par différences, apprentissage dans les espaces de différences, vérification hors-ligne des signatures manuscrites, Fuzzy Vault
Directeur de mémoire/thèse:
Directeur de mémoire/thèse
Sabourin, Robert
Co-directeurs de mémoire/thèse:
Co-directeurs de mémoire/thèse
Granger, Éric
Programme: Doctorat en génie > Génie
Date de dépôt: 11 juin 2014 15:32
Dernière modification: 10 déc. 2016 16:23
URI: http://espace.etsmtl.ca/id/eprint/1326

Actions (Identification requise)

Dernière vérification avant le dépôt Dernière vérification avant le dépôt

Statistique

Plus de statistique...