La vitrine de diffusion des mémoires et thèses de l'ÉTS
RECHERCHER

Développement d'un système d'identification des dialogues problématiques dans le système de dialogue personne-machine

Truong, Le Hoang (2008). Développement d'un système d'identification des dialogues problématiques dans le système de dialogue personne-machine. Mémoire de maîtrise électronique, Montréal, École de technologie supérieure.

[img]
Prévisualisation
PDF
Télécharger (21MB) | Prévisualisation
[img]
Prévisualisation
PDF
Télécharger (4MB) | Prévisualisation

Résumé

Dans ce memoire, nous proposons un outil de classification automatique de dialogues problematiques dans un contexte d'un systeme de dialogue personne-machine. Le domaine d'application de cet outil est celui du forage de dormees (data mining), un sous domaine du domaine de I'apprentissage machine (machine learning). L'architecture de cet outil est modulaire et extensible afin de faciliter 1'experimentation de differents paradigmes de classification. L'outil utilise plusieurs schemes d'apprentissage machine tels que I'arbre de decision C4.5 et I'arbre de modelisation logistique pour la classification de dialogue et les parametres utilises provierment de la plateforme PARADISE. De plus, nous etudions I'ajout de deux nouveaux parametres : mots negatives de reconnaissance et repetitions de mots. L'outil est teste selon la technique de validation croisee avec 10 validations croisees sur deux corpus publiquement distribues par le Linguistic Data Consortium (DARPA Communicator 2000 et DARPA Communicator 2001). Les resultats obtenus compares a ceux-la de I'etat de Part montrent que notre PDl est plus performant et que les deux nouveaux parametres ameliorent la performance globale de l'outil.

Titre traduit

Development of a dialog classification system identifying problematic dialogs in human-computer dialog system

Résumé traduit

In this thesis, we develop a dialog classification tool containing a Problematic Dialog Identifier (PDI) that helps automate the task of identifying problematic dialogs in a context of a Human-Computer Dialog System (HCDS). This automatic tool is a practical Data Mining application in Machine Learning domain. It is modular and easily extensible. It uses several popular, widely used learning schemes such as C4.5 Tree, Logistic Model Tree for dialog classification. We also study the effect of two new potentially good features, namely negative acknowledgement words and system repetitions, on the performance of PDI. The PDI is tested with 10-fold stratified cross-validation on two publicly distributed corpora DARPA Communicator 2000 and 2001. The obtained results when compared with those of state-of-the-art show that our PDI outperforms and those two features are really good.

Type de document: Mémoire ou thèse (Mémoire de maîtrise électronique)
Renseignements supplémentaires: "Mémoire présenté à l'École de technologie supérieure comme exigence partielle à l'obtention de la maîtrise en génie." Bibliogr : f. [73]-76.
Mots-clés libres: apprentissage, automatique, classification, donnee, dialogue, forage, identificateur, identification, plantation, machine, outil, personne, personne-machine, problematique, systeme
Directeur de mémoire/thèse:
Directeur de mémoire/thèse
Dumouchel, Pierre
Programme: Maîtrise en ingénierie > Génie
Date de dépôt: 11 août 2010 18:43
Dernière modification: 21 déc. 2016 00:36
URI: http://espace.etsmtl.ca/id/eprint/117

Actions (Identification requise)

Dernière vérification avant le dépôt Dernière vérification avant le dépôt

Statistique

Plus de statistique...