LIZARD, un assistant pour le développement de ressources linguistiques à base de cascades de transducteurs

Antonio Balvet
2002 Traitement Automatique des Langues Naturelles & Rencontre des Étudiants Chercheurs en Informatique pour le Traitement Automatique des Langues  
Nous présentons un outil visant à assister les développeurs de ressources linguistiques en automatisant la fouille de corpus. Cet outil, est guidé par les principes de l'analyse distributionnelle sur corpus spécialisés, étendue grâce à des ressources lexicales génériques. Nous présentons une évaluation du gain de performances dû à l'intégration de notre outil à une application de filtrage d'information et nous élargissons le champ d'application de l'assistant aux études sur corpus menées à
more » ... e de cascades de transducteurs à états finis. We present a tool providing linguistic resources developers with automated corpus analysis features. Our tool implements specialized corpora distributional analysis principles, extended by the integration of external generic lexical resources. We present an evaluation of the gain in performance attributable to our tool, for a text filtering task. We also widen our tool's scope of applications to transducer cascades-based corpus processing activities. Voir, par exemple, (Mohri, 2001) pour un exposé d'une techniques d'analyse partielle, appliquée à la reconnaissance vocale, ou encore (Abney, 1996) pour l'analyse syntaxique. 2 Voir (Silberztein et al., 2001) pour plus de précisions sur la plate-forme Intex.
dblp:conf/taln/Balvet02 fatcat:aq4gvuoq2bhsbokmim5oi7nkgu