Moffette, Olivier (2011). Extraction des informations nutritionnelles d'une étiquette alimentaire par vision artificielle. Mémoire de maîtrise électronique, Montréal, École de technologie supérieure.
Prévisualisation |
PDF
Télécharger (2MB) | Prévisualisation |
Prévisualisation |
PDF
Télécharger (724kB) | Prévisualisation |
Résumé
Ce projet à pour but le développement d’une application, basée sur un moteur de reconnaissance de caractères, qui permet l’acquisition de l’information contenue dans des photographies représentant des boites d’informations nutritionnelles. Beaucoup de projets de recherche et d’articles traitent de différentes composantes de la reconnaissance de caractère, mais très peu portent sur l’intégration globale de ces différentes composantes afin de former un tout. En plus de la reconnaissance de caractères, ce projet porte également sur le traitement et l’analyse des données une fois l’extraction de l’information complétée.
Pour notre problématique, nous n’avons trouvé aucune banque d’images de test. Nous avons donc développé une banque d’images de boites d’informations nutritionnelles avec l’aide de l’entreprise GS1 Canada. Par la suite, nous en avons extrait manuellement toutes les informations pertinentes. Cette banque d’images sert de référence pour l’évaluation des performances des différentes configurations du système développé. Notre projet n’a pas pour objectif d’évaluer les diverses composantes d’un système de reconnaissance de caractères mais plutôt d’optimiser les résultats du système dans son ensemble. Dans le même ordre d’idée, le principal critère d’évaluation de la performance de notre système est le pourcentage des boites qui sont extraites sans aucune erreur; ce qui est assez différent de l’approche qui est normalement utilisé pour évaluer les moteurs de reconnaissance de caractères soit d’évaluer le pourcentage de caractères adéquatement reconnus.
Dans ce projet, nous utilisons le moteur de reconnaissance de caractères Tesseract qui est parmi les plus performants dans la catégorie des logiciels libres. Le projet a tout de même été conçu de façon à permettre l’interchangeabilité du moteur de reconnaissance de caractères.
Ce projet est séparé en deux grandes phases. La première phase permet de comparer les différentes versions de l’OCR ainsi que de vérifier la pertinence de l’utilisation de certains modules de correction. La deuxième, quant à elle, permet d’ajuster divers paramètres de l’application afin d’optimiser les résultats.
Grâce à cette approche, nous avons réussi à traiter 58% des images sans générer la moindre erreur et au total plus de 83 % des images traitées ont généré deux erreurs ou moins. Ces résultats ne permettent malheureusement pas d’automatiser totalement le procédé, mais ils confirment la possibilité d’utiliser cette application afin d’effectuer un premier traitement massif de l’information avant d’être validée et peaufinée par un utilisateur.
Titre traduit
Nutrionnal information extraction from food label by artificial vision
Résumé traduit
This project aims at developing an application based on a character recognition engine, which allows the extraction of information contained in photographs of nutritional information boxes. A lot of research projects and articles deal with isolated recognition character components, but few deal with the overall integration of these components. In addition to the character recognition subject, this project also covers the processing and analysis of data after the extraction of the information.
For our problem, we found no bank of test images. We have developed an image database of nutritional information boxes with the help of GS1, a Canadian industrial collaborator. Subsequently, we manually extracted all relevant information. This image bank is used as reference for evaluating the performance of different configurations of our system. Our project did not aim at evaluating the various components of a system for character recognition separately but rather to optimize the results of the system as a whole. In the same vein, the main criterion for evaluating the performance of our system is the percentage of boxes, which are extracted without any error, which is quite different from the percentage of adequately recognized characters which is normally used to assess character recognition engines.
In this project, we use the Tesseract character recognition engine that is among the best within the open source class. Yet the project has been designed to allow the interchangeability of the character recognition engine.
This project is separated into two phases. The first phase is aimed at comparing different versions of the OCR and to verify the appropriateness of using some correction modules. On the other hand, the second phase is use to adjust various application settings to optimize the results.
With this approach, we successfully treated 58% of the images without generating any error and in total more than 83% of the processed images generated two errors or less. These results unfortunately do not permit to fully automate the process, but they confirm the possibility of using this application to conduct the first large-scale treatment of information before being validated and refined by a user.
Type de document: | Mémoire ou thèse (Mémoire de maîtrise électronique) |
---|---|
Renseignements supplémentaires: | "Mémoire présenté à l'École de technologie supérieure comme exigence partielle à l'obtention de la maîtrise en génie de la production automatisée". Bibliogr. : f. [115]-118. |
Mots-clés libres: | Vision artificielle (Robotique) Reconnaissance de caractères (Informatique) Emballages. Sources d'information Alimentation. Sources d'information Nutrition. Moteur, OCR, Tesseract |
Directeur de mémoire/thèse: | Directeur de mémoire/thèse Landry, Jacques-André |
Programme: | Maîtrise en ingénierie > Génie de la production automatisée |
Date de dépôt: | 16 mai 2011 14:16 |
Dernière modification: | 27 févr. 2017 22:00 |
URI: | https://espace.etsmtl.ca/id/eprint/869 |
Gestion Actions (Identification requise)
Dernière vérification avant le dépôt |