La vitrine de diffusion des mémoires et thèses de l'ÉTS
RECHERCHER

Automatic recognition of handwritten dates on brazilian bank cheques

Morita, Marisa Emika (2003). Automatic recognition of handwritten dates on brazilian bank cheques. Thèse de doctorat électronique, Montréal, École de technologie supérieure.

[img]
Prévisualisation
PDF
Télécharger (7MB) | Prévisualisation

Résumé

Cette thèse présente un système hybride HMM-MLP pour la segmentation et la reconnaissance de l'écriture manuscrite non-contrainte et plus particulièrement des dates présentes sur les chèques brésiliens. Le système développé doit tenir compte de nombreuses sources de variabilité, tel que les différents styles et types de données, les variations présentes dans le champ correspondant aux dates ou encore les cas de segmentation difficile. Tous ceci rend bien évidemment la tâche particulièrement complexe.

Le système présenté s'appuie sur une modélisation Markovienne (HMM) pour identifier et séparer la date en sous-champs. Le concept de méta-classes de chiffres est utilisé afin de réduire la dimension du lexique des jours et des années et permettre ainsi une segmentation plus précise. Ensuite, les trois sous-champs principaux (jour, mois et année) sont reconnus en utilisant le classifieur spécialisé relatif au type de données identifié. Dans ce cas, nous proposons d'utiliser un système HMM pour reconnaître et vérifier le mot correspondant au mois et un réseau MLP pour décoder les chiffres représentant le jour et l'année. La stratégie de reconnaissance des chaînes de chiffres utilise aussi des méta-classes de chiffres de manière à réduire la taille du lexique et à améliorer les taux de reconnaissance. De plus, afin de valider notre stratégie combinant la reconnaissance des chaînes de chiffres et la vérification au niveau mot, nous avons utilisé d'autre base de données que celle des dates. D'autre part, le système comprend un module de décision final intégrant la notion de rejet.

Enfin, nous proposons une approche de sélection de caractéristiques adaptée aux apprentissages non-supervisés. Pour ce faire, nous utilisons un algorithme génétique multi-critères qui génère un ensemble de solutions, correspondant aux meilleurs compromis entre les caractéristiques discriminantes et le nombre de regroupements pertinents. La stratégie proposée a été évaluée sur des problèmes synthétiques où les caractéristiques significatives et les regroupements appropriés sont connus pour tous les sous-espaces de caractéristiques possibles. Elle a ensuite été utilisée pour l'optimisation des HMM dans le contexte d'un apprentissage supervisé. Notre approche est alors évaluée en effectuant un certain nombre d'expériences sur la reconnaissance des mots isolés correspondant au mois. L'approche a aussi été utilisée pour optimiser la vérification de mots du système de reconnaissance de date. Ainsi, nous avons démontré expérimentalement la faisabilité et l'efficacité de l'approche proposée.

Type de document: Mémoire ou thèse (Thèse de doctorat électronique)
Renseignements supplémentaires: "Thesis presented to the École de technologie supérieure in partial fulfillment of the thesis requirement for the degree of philosophiae doctor in engineering". La numérotation de cet ouvrage est erronée. Bibliogr.: f. [158]-170.
Mots-clés libres: Automatique, Cheque, Date, Ecriture, Manuscrit, Reconnaissance
Directeur de mémoire/thèse:
Directeur de mémoire/thèse
Sabourin, Robert
Co-directeurs de mémoire/thèse:
Co-directeurs de mémoire/thèse
Suen, Ching Y.
Programme: Doctorat en génie > Génie
Date de dépôt: 09 mai 2011 19:23
Dernière modification: 24 févr. 2012 14:06
URI: http://espace.etsmtl.ca/id/eprint/758

Actions (Identification requise)

Dernière vérification avant le dépôt Dernière vérification avant le dépôt

Statistique

Plus de statistique...