Méthodes linguistiques pour l'expansion de requêtes. Une expérience basée sur l'utilisation du voisinage distributionnel

Aurélie Picton, Cécile Fabre, Didier Bourigault
2008 Revue Française de Linguistique Appliquée  
Distribution électronique Cairn.info pour Pub. linguistiques. © Pub. linguistiques. Tous droits réservés pour tous pays. La reproduction ou représentation de cet article, notamment par photocopie, n'est autorisée que dans les limites des conditions générales d'utilisation du site ou, le cas échéant, des conditions générales de la licence souscrite par votre établissement. Toute autre reproduction ou représentation, en tout ou partie, sous quelque forme et de quelque manière que ce soit, est
more » ... rdite sauf accord préalable et écrit de l'éditeur, en dehors des cas prévus par la législation en vigueur en France. Il est précisé que son stockage dans une base de données est également interdit. Powered by TCPDF (www.tcpdf.org) Document téléchargé depuis www.cairn.info ---207.241.231.108 -10/02/2020 07:31 -© Pub. linguistiques Document téléchargé depuis www.cairn.info ---207.241.231.108 -10/02/2020 07:31 -© Pub. linguistiques Rev. franç. de linguistique appliquée, 2008, XIII-1 (83-95) Méthodes linguistiques pour l'expansion de requêtes. Une expérience basée sur l'utilisation du voisinage distributionnel Aurélie Picton, Cécile Fabre, Didier Bourigault Université de Toulouse-Le Mirail / CNRS Résumé : Cet article présente les résultats d'une expérience d'expansion de requêtes qui exploite des informations sémantiques fournies par un programme d'analyse distributionnelle automatique appliqué à un corpus de français de grande taille. Cette méthode permet de mettre au jour des relations qui dépassent largement les relations lexicales classiques. Une étude globale puis locale des performances de la recherche montre l'intérêt de recourir à des relations sémantiques diversifiées, qui reflètent les rapprochements sémantiques établis dans le corpus, à condition de contrôler l'utilisation de ces ressources pour l'expansion par une procédure de filtrage à partir des textes de la base (distributional feedback) et par une analyse des caractéristiques linguistiques de la requête. Abstract: This paper reports the results of a query expansion experiment making use of semantic data produced by a program that automatically performs the distributional analysis of a large corpus. This method allows us to take into account relations that go beyond classic lexical relations. We look at these results from both a global and a local perspective, showing that such broader and corpus-based semantic relations may be useful, provided that the expansion is controlled by a filtering technique based on the texts of the database (distributional feedback), and by an analysis of the query linguistic characteristics.
doi:10.3917/rfla.131.0083 fatcat:voldfwy7ezalvkz3lwy23vw54i