Un modèle probabiliste pour la détection de l'incertitude dans le langage naturel

Pierre-Antoine Jean, Sébastien Harispe, Sylvie Ranwez, Patrice Bellot, Jacky Montmain
2016 Document Numérique  
La détection de l'incertitude dans le langage naturel est centrale pour le développement de nombreux modèles exploitant l'analyse de textes e.g. questions-réponses, raisonnement approché, enrichissement de bases de connaissances. Après une synthèse des différentes classifications de l'incertitude et des méthodes de détection correspondantes, cet article introduit une approche supervisée et générique de détection de l'incertitude. Celle-ci se base sur l'analyse statistique de différentes
more » ... différentes caractéristiques lexicales et syntaxiques afin de construire une représentation vectorielle d'une phrase analysable par des méthodes de classification éprouvées. L'évaluation que nous proposons tient compte des différentes dimensions de l'incertitude et de la nature des textes. Les résultats obtenus sur différents jeux de validation soulignent la performance globale de la méthode proposée et ouvrent de nombreuses perspectives. ABSTRACT. Designing approaches able to automatically detect uncertain natural language expressions is central to design efficient models based on text analysis -for domains such as question-answering, approximate reasoning, knowledge-based population. This article proposes an overview of several contributions and classifications defining the concept of uncertainty expressions in natural language, and their related detection methods that have been proposed so far. A new supervised and generic approach is next introduced for this specific task; it is based on the statistical analysis of multiples lexical and syntactic features used to characterize sentences through vector-based representations that can be analyzed by proven classification methods. The global performance of our approach is demonstrated and discussed with regard to various dimensions of uncertainty and text specificities. MOTS-CLÉS : Détection de l'incertitude, Classification binaire, Modèle supervisé.
doi:10.3166/dn.19.2-3.53-73 fatcat:n6wv63krtjgojlfektu7w7x43m