Levasseur, Yan (2008). Techniques de l'intelligence artificielle pour la classification d'objets biologiques dans des images bidimensionnelles. Mémoire de maîtrise électronique, Montréal, École de technologie supérieure.
Prévisualisation |
PDF
Télécharger (63MB) | Prévisualisation |
Prévisualisation |
PDF
Télécharger (9MB) | Prévisualisation |
Résumé
La reconnaissance visuelle d'objets biologiques comme les produits agro-alimentaires et les especes vegetales en milieu naturel a profite de percees majeures lors des 30 dernieres annees. Aujourd'hui, des algorithmes de reconnaissance performants sont utilises pour evaluer la qualite de productions agricoles et faire le suivi d'ecosysteme pour en assurer la protection. Dans la plupart des cas, ce sont des experts en vision et en informatique qui ont developpe les solutions personnalisees qui ont permis d'atteindre les resultats desires.
L'objectif de la recherche presentee est de foumir des recommandations pour le developpement d'un algorithme de reconnaissance de formes dans des images qui soit generique et qui necessite le moins d'intervention humaine possible. Un tel algorithme pourrait etre utilise par les non experts, par exemple les ingenieurs en agro-alimentaire, les botanistes et les biologistes. Pour atteindre notre objectif, nous avons etudie les etapes du processus de reconnaissance a partir d'images.
En pratique, nous avons mis sur pied un systeme de segmentation, d'extraction de caracteristiques et de classification, en plus d'avoir developpe un algorithme de Programmation Genetique (PG). Nous avons integre ce dernier au logiciel libre d'exploration des donnees Weka, afin d'encourager la mise en commun des efforts de recherche sur les algorithmes evolutionnaires.
Les classificateurs utilises pour nos experimentations sont le classificateur naif de Bayes, l'arbre de decision C4.5, le K Plus Proche Voisins (KPPV), la PG, le Separateur a Vastes Marges (SVM) et le Perceptron Multicouche (PM). Dans une seconde serie d'experiences, nous avons combine chacun de ces classificateurs, a 1'exception du KPPV, au meta algorithme de boosting.
Nous avons compare les resultats de classification des six algorithmes choisis pour six bases de donnees distinctes dont trois ont ete creees par nous. Les bases utilisees proviennent d'images de cereales, de grains de pollen, de noeuds de bois, de raisins sees, de feuilles d'arbres et de caracteres de I'alphabet romain.
Suite a une segmentation des bases d'images, nous avons extrait, a partir de chaque objet, une quarantaine de caracteristiques. Une base de donnees alternatives a ete creee grace a la transformation par Analyse en Composante Principale (ACP).
Finalement, nous avons compilé les resultats de classification des six classificateurs, puis de leur combinaison par boosting pour les caracteristiques de base et pour les caracteristiques transformees. Chaque experience a ete realisee 50 fois avec une separation aleatoire des bases d'apprentissage et de test.
Nous avons observe de bonnes performances de classification pour les problemes comportant un grand nombre d'echantillons d'apprentissage. La performance des classificateurs, selon leur taux d'erreur median, est consistante pour la plupart des bases de donnees. Le PM et le SVM obtiennent generalement les meilleurs taux de classification. Pour les problèmes comportant un grand nombre d'echantillons, notre approche obtient des résultats encourageants.
Malgre la superiorite apparente de certains classificateurs, nos experimentations ne nous permettent pas d'emettre une recommandation sur I'utilisation prioritaire d'un classificateur dans tous les cas. Nous suggerons plutot I'utilisation d'une metaheuristique evolutive pour l'analyse des donnees d'un probleme afin de choisir ou de combiner des classificateurs appropries. Nous avan^ons egalement que la performance de classification de notre approche pourrait etre amelioree par I'ajout de nouvelles caracteristiques pertinentes, puis par l'optimisation des parametres des classificateurs en fonction des donnees.
Titre traduit
Artificial intelligence techniques for biological object classification in bidimensional images
Résumé traduit
The visual recognition of biological objects such as food products and plant material in natural environment benefited from major openings during the last 30 years. Today, powerful recognition algorithms are used to evaluate the quality of food productions and to monitor ecosystems to ensure its protection. In the majority of the cases, vision and data processing experts developed customized solutions which allowed reaching the desired results.
The goal of this research is to provide recommendations for the development of a generic object recognition system (from images) which would require as little human intervention as possible. Such an algorithm could be used by non experts such as industrial engineers, botanists and biologists. To this end, we studied the stages of the recognition process starting from images.
In practice, we designed a system for segmentation, feature extraction and classification. In addition, we developed a Genetic Programming (GP) classifier. We integrated the GP algorithm to the free and open source data-mining software Weka to support collaborative research efforts in evolutionary computing.
Six different classifiers were used for our experiments. They are the naïve Bayes, C4.5 decision tree, K Nearest Neighbour (KNN), GP, Support Vector Machine (SVM) and Multilayered Perceptron (MP). In a second round of experiments, we combined each of these classifiers (except for KNN) with the boosting meta-algorithm.
We compared the classification results from the six algorithms for six distinct databases of which we created three. The databases contain information extracted from images of cereals, pollen, wood knots, raisins, tree leaves and computer generated roman characters.
We automatically segmented the majority of the images. We then extracted nearly 40 features from each object. We obtained an alternate database using a transformation by Principal Component Analysis (PCA). Finally, we compiled the classification results of the six classifiers, then of their combination with boosting for the basic feature set and for the transformed set. Each experiment was carried out 50 times, with a random separation of the training and test databases.
We observed good recognition rates for problems comprising a large number of training samples. The performance ranking of the classifiers, according to their median error rate, is consistent for the majority of the problems. The MP and the SVM generally obtain the best classification rates. For problems containing a large number of samples, our approach obtained encouraging results.
In spite of the apparent superiority of some classifiers, the experiments do not enable us to put forth a recommendation on the priority use of a specific classifier in all cases. We rather suggest the use of an evolutionary meta-heuristic for the analysis of a problem's data in order to choose or to combine suitable classifiers. We also put forward that our approach's classification performance could be improved with the addition of new relevant features and the optimization of the classifiers' parameters according to the data.
Type de document: | Mémoire ou thèse (Mémoire de maîtrise électronique) |
---|---|
Renseignements supplémentaires: | "Mémoire présenté à l'École de technologie supérieure comme exigence partielle à l'obtention de la maîtrise en génie de la production automatisée." Bibliogr : f. [164]-172. |
Mots-clés libres: | algorithme, artificiel, bidimensionnel, biologique, classification, forme, generique, image, intelligence, objet, programmation, reconnaissance |
Directeur de mémoire/thèse: | Directeur de mémoire/thèse Landry, Jacques-André |
Programme: | Maîtrise en ingénierie > Génie de la production automatisée |
Date de dépôt: | 10 août 2010 13:18 |
Dernière modification: | 19 déc. 2016 22:22 |
URI: | https://espace.etsmtl.ca/id/eprint/115 |
Gestion Actions (Identification requise)
Dernière vérification avant le dépôt |