Adaptation du boosting à l'inférence grammaticalevial'utilisation d'un oracle de confiance

Jean-Christophe Janodet, Richard Nock, Marc Sebban, Henri-Maxime Suchier
2005 Revue d'intelligence artificielle : Revue des Sciences et Technologies de l'Information  
Cet article présente une adaptation du boosting à l'inférence grammaticale. Notre but est d'améliorer les performances d'un algorithme à base de fusion d'états, en présence de données bruitées. Notre algorithme de boosting utilise une nouvelle règle de mise à jour des poids qui tient compte d'une information supplémentaire fournie par un oracle. Cette information est une évaluation de la confiance en l'étiquette d'un exemple. Nous montrons que la règle de mise à jour des poids conserve les
more » ... iétés théoriques du boosting. Quant à l'oracle, il doit être simulé en pratique et nous proposons une construction adaptée à l'inférence grammaticale. Nous décrivons enfin une étude expérimentale sur l'algorithme à base de fusions d'états RPNI , dont les performances sont significativement améliorées. ABSTRACT. In this paper we focus on the adaptation of boosting to grammatical inference. We aim at improving the performances of state merging algorithms in the presence of noisy data by using, in the update rule, additional information provided by an oracle. This strategy requires the construction of a new weighting scheme that takes into account the confidence in the labels of the examples. We prove that our new framework preserves the theoretical properties of boosting. Using the state merging algorithm RPNI * , we describe an experimental study on various datasets, showing a dramatic improvement of performances. MOTS-CLÉS : boosting, inférence grammaticale. KEYWORDS: boosting, grammatical inference. RSTI -RIA -19/2005. Apprentissage automatique, pages 713 à 740 1. RPNI identifie polynomialement par données fixées la classe des langages rationnels représentée par des AFD (Oncina et al., 1992) .
doi:10.3166/ria.19.713-740 fatcat:l73p7m5xu5gqhl3dlgverrjfpi