île Rousse 2005 Journée sur les systèmes d'information élaborée MESURE QUALITATIVE DE LA SIMILARITE DE CLASSES PRODUITES PAR DES METHODES D'AGREGATION DIFFERENTES

Fidelia Ibekwe-Sanjuan, Université De Lyon, Albert Thomas Lyon
unpublished
Mots clés : méthodes d'agrégations, comparaison de classes, relations linguistiques, associations lexicale, indice de similarité Résumé. La comparaison de classifications produites par des algorithmes d'agrégation différents est un problème complexe. A notre connaissance, il n'existe pas de protocole ou de métrique directs pour comparer de telles classifications. Il en résulte une quasi-impossibilité de discuter des apports respectifs des méthodes existantes, dès lors que les métriques
more » ... métriques habituelles (Rand Index) ne peuvent pas s'appliquer. Dans cette communication, nous proposons des critères qualitatifs de comparaison de classes issues de méthodes d'agrégation différentes. Nous avons pris deux situations extrêmes dans lesquelles il subsiste d'importantes différences dans les deux méthodes, l'une est basée sur la méthode des mots associés et l'autre sur les relations linguistiques. Des différences existent à plusieurs niveaux dans ces deux méthodes : au niveau des entrées à l'algorithme de classification, au niveau de la taille des matrices, au niveau de la taille des classes produites et enfin au niveau des paramètres de classification. Le but étant d'arriver à classer en tête, par un indice de relation fondé sur l'association lexicale des éléments des classes, les classes des deux méthodes dont les contenus seraient les plus similaires. La similarité être comprise ici dans son acception linguistique. Les opérations d'associations lexicales qui permettent de rapprocher deux éléments de deux classes donnent lieu, sur le plan sémantique à des relations d'équivalence (correspondance lexicale exacte), de synonymie (via une ressource externe telle WordNet), d'hyperonymie ou d'hyponymie et enfin à des relations d'association. Les résultats expérimentaux montrent la pertinence de la démarche. île Rousse 2005 Journée sur les systèmes d'information élaborée http://isdm.univ-tln.fr
fatcat:bttmpw5rn5aflhpzy2caq4dqea