Filters








159 Hits in 4.3 sec

Le corpus Sequoia : annotation syntaxique et exploitation pour l'adaptation d'analyseur par pont lexical (The Sequoia Corpus : Syntactic Annotation and Use for a Parser Lexical Domain Adaptation Method) [in French]

Marie Candito, Djamé Seddah
2012 Traitement Automatique des Langues Naturelles & Rencontre des Étudiants Chercheurs en Informatique pour le Traitement Automatique des Langues  
Nous présentons dans cet article la méthodologie de constitution et les caractéristiques du corpus Sequoia, un corpus en français, syntaxiquement annoté d'après un schéma d'annotation très proche de celui  ...  du French Treebank (Abeillé et Barrier, 2004) , et librement disponible, en constituants et en dépendances.  ...  Remerciements Nous remercions chaleureusement les trois annotatrices Vanessa Combet, Catherine Moreau-Mocquay et Virginie Mouilleron pour leur travail très consciencieux.  ... 
dblp:conf/taln/CanditoS12 fatcat:djp7sn3fsrduddbrwqsqzf7cum

Intégration des données d'un lexique syntaxique dans un analyseur syntaxique probabiliste [article]

Anthony Sigogne
2014 arXiv   pre-print
This article reports the evaluation of the integration of data from a syntactic-semantic lexicon, the Lexicon-Grammar of French, into a syntactic parser.  ...  LEXIQUE-GRAMMAIRE Les tables du Lexique-Grammaire constituent aujourd'hui une des principales sources d'informations lexicales syntaxiques pour le français 2 .  ...  INTRODUCTION Les lexiques syntaxiques sont des ressources très riches pour les langues qui en disposent.  ... 
arXiv:1404.1872v1 fatcat:kyzut6ldunahbi3fpm3ydn445a

Compression de phrases par élagage de leur arbre morpho-syntaxique. Une première application sur les phrases narratives

Mehdi Yousfi-Monod, Violaine Prince
2006 Techniques et sciences informatiques  
Nous proposons une technique de contraction de phrases qui se fonde sur l'étude de la fonction syntaxique et de la position dans l'arbre syntaxique des constituants des phrases.  ...  Nous sélectionnons les constituants à supprimer avec un système de règles utilisant les arbres et variables de l'analyse morpho-syntaxique de SYGFRAN.  ...  Remerciements Les auteurs de cet article remercient très vivement Augusta Mela, maître de conférences en sciences du langage, de sa contribution sur le plan linguistique, et les relecteurs de TSI pour  ... 
doi:10.3166/tsi.25.437-468 fatcat:7r72pigg7nf77dgpsna6cycz2m

Évaluation de lexiques syntaxiques par leur intégartion dans l'analyseur syntaxiques FRMG [article]

Elsa Tolone, Éric De La Clergerie (INRIA Rocquencourt), Sagot Benoit
2011 arXiv   pre-print
The evaluation was made on the part of the EASy corpus used in the first evaluation campaign Passage.  ...  In this paper, we evaluate various French lexica with the parser FRMG: the Lefff, LGLex, the lexicon built from the tables of the French Lexicon-Grammar, the lexicon DICOVALENCE and a new version of the  ...  ) ; et d'exploiter les annotations syntaxiques résultantes pour créer une ressource linguistique plus riche et plus étendue : un treebank pour le français.Six types de constituants ont été choisis pour  ... 
arXiv:1111.3152v1 fatcat:clfvy6z4ircxxc7tdunhfjhtfy

S XPipe 2: an architecture for surface preprocessing of raw corpora

Benoît Sagot, Pierre Boullier
2008 Revue TAL  
Nous présentons les fondements théoriques des différents modules, leur mise en oeuvre pour le français et pour certains une évaluation quantitative. ABSTRACT.  ...  Développé pour le français mais également pour d'autres langues, SXPipe 2 comprend, entre autres, divers modules de reconnaissances d'entités nommées dans du texte brut, un segmenteur en phrases et en  ...  Elle permet de transformer un texte brut en un DAG 2 de formes (voir cidessous), entrée valide pour un analyseur syntaxique complet, pour un outil de normalisation textuelle (par retransformation en texte  ... 
dblp:journals/tal/SagotB08 fatcat:jq5vlxmzojcpvo5kwykobiwwiq

Services Web pour l'annotation sémantique d'information spatiale à partir de corpus textuels

Ludovic Moncla, Mauro Gaio, Géraldine Del Mondo
2018 Revue internationale de géomatique  
Un avantage de cette approche est la possibilité d'obtenir des traitements partiels ou encore de mettre en concurrence certains modules réalisant la même tâche. ABSTRACT.  ...  L'annotation sémantique d'information spatiale a pour objectif de repérer des mots ou des syntagmes décrivant des références géographiques (noms de lieux) ainsi que diverses expressions spatiales associées  ...  Par ailleurs, 47% des ENE spatiales sont composées d'une forme catégorisante (ENE de niveau >0). 4 Evaluation TABLE 2 . 2 Évaluation de l'annotation des EN Perdido CasEN Français Espagnol Italien  ... 
doi:10.3166/rig.2018.00066 fatcat:opkjqd56ozbshdl3zrzmommhha

s. n. — Matemáticas y Tratamiento de Corpus. Logroño : Fundacion San Millán de la Cogolla, 2002, 350 p

Sylvie Mellet
2003 Corpus  
Les annotations se distribuent sur cinq niveaux : orthographique et métatextuel, morpho-syntaxique, syntaxique de constituants, syntaxique fonctionnel et lexico-sémantique.  ...  L'auteur souligne la faiblesse des analyseurs syntaxiques à base de règles et en donne un exemple très probant avec les phénomènes d'accord (loi d'unification) : un analyseur qui tient pour acquis qu'en  ... 
doi:10.4000/corpus.43 fatcat:dlcddmnr5zfy5dptoa7bm4imba

TALC-sef, Un corpus étiqueté de traductions littéraires en serbe, anglais et français

Antonio Balvet, Dejan Stosic, Aleksandra Miletic, Franck Neveu, Peter Blumenthal, Linda Hriba, Annette Gerstenberg, Judith Meinschaefer, Sophie Prévost
2014 SHS Web of Conferences  
The GRACE French part-of-speech tagging evaluation task.  ...  Outre l'intérêt que représentent les analyses en dépendances pour un tel projet de corpus aligné, l'analyse syntaxique à profondeur modulable de grands volumes de textes constitue une technique aujourd'hui  ...  La seule autre alternative semble être celle de (Utvic 2011), qui a constitué un corpus de un million de mots viii , annoté grâce à un jeu d'étiquettes de seulement 16 catégories morpho- syntaxiques principales  ... 
doi:10.1051/shsconf/20140801035 fatcat:lhhmk5rafbaj3cm5cmbtxljk2m

Lexical acquisition from corpora: the case of subcategorization frames in French

Cédric Messiant, Kata Gábor, Thierry Poibeau
2010 Revue TAL  
Nous décrivons dans cet article une méthode permettant l'acquisition d'un lexique syntaxique des verbes du français à partir de l'analyse automatique de gros corpus.  ...  The method is evaluated against existing lexical resources: we show that our system is capable of producing new frames that were not previously registered.  ...  pour le Traitement Automatique des Langues).  ... 
dblp:journals/tal/MessiantGP10 fatcat:cnaylwr4xjawljb7gsdmtob5pi

Error Mining on Syntactic Parser Output

Benoît Sagot, Éric Villemonte de la Clergerie
2008 Revue TAL  
Nous présentons une méthode de fouille d'erreurs pour détecter automatiquement des erreurs dans les ressources utilisées par les systèmes d'analyse syntaxique.  ...  Nous avons mis en oeuvre cette méthode sur le résultat de l'analyse de plusieurs millions de mots par deux systèmes d'analyse différents qui ont toutefois en commun le lexique syntaxique et la chaîne de  ...  d'erreurs dans les analyseurs syntaxiques.  ... 
dblp:journals/tal/SagotC08 fatcat:tt7jcgk5pzfdhokquyte7souta

Un état des lieux du traitement automatique du mandarin

Laurent Prévot, Pierre Magistry, Chu-Ren Huang
2015 Faits de langues  
Les auteurs tiennent à remercier un relecteur anonyme pour ses commentaires précis, qui ont grandement contribué à améliorer l'article. 1 Nous pensons ici à l'importance croissante de cette langue dans  ...  Remerciements : Ce travail a pu être réalisé grâce aux mobilités des deux premiers auteurs effectuées dans le cadre des projets financés par l'union européenne Erasmus Mundus Action 2 «Multilingualism  ...  Un programme de conversion pour obtenir une annotation en constituants est disponible. 17 8.  ... 
doi:10.1163/19589514-046-01-900000006 fatcat:nsf3xc6f6jecfbd7lgetu7a3mq

Le projet ORFÉO : un corpus d'étude pour le français contemporain

Christophe Benzitoun, Jeanne-Marie Debaisieux, Henri-José Deulofeu
2016 Corpus  
par des annotations syntaxiques et la plate-forme d'interrogation.  ...  Pour la partie écrite, les performances de notre analyseur sont comparables à celles des autres ressources : 86 % d'analyses correctes en moyenne.  ... 
doi:10.4000/corpus.2936 fatcat:7poy63qgg5fkppfrevtshgufsy

Création semi-automatique d'un corpus annoté pour l'analyse d'opinions

Driss Sadoun, F. Neveu, G. Bergounioux, M.-H. Côté, J.-M. Fournier, L. Hriba, S. Prévost
2016 SHS Web of Conferences  
Nous décrivons une méthode semi-automatique pour la création d'un corpus annoté en français.  ...  Des résultats empiriques montrent que notre méthode permet d'accélérer et de faciliter le processus d'annotation. Le corpus résultat est annoté à la fois sémantiquement et syntaxiquement.  ...  Ces résultats montrent que la pré-annotation automatique constitue une aide précieuse pour les annotateurs.  ... 
doi:10.1051/shsconf/20162711008 fatcat:e7irchtw3bfz5id5tbiwzu5onm

Classification de courriers électroniques. Une approche par apprentissage basée sur des modèles linguistiques

Omar Nouali, Alain Regnier, Philippe Blache
2005 Revue d'intelligence artificielle : Revue des Sciences et Technologies de l'Information  
Pour tenter de statuer sur la faisabilité de notre approche et d'évaluer son efficacité, nous l'avons expérimenté sur un corpus de 1 200 messages.  ...  D'une part, en utilisant une méthode d'apprentissage automatique permettant à un système de filtrage d'élaborer des profils utilisateur.  ...  Pour mesurer les performances du réseau, il convient de constituer, outre l'ensemble d'apprentissage utilisé pour déterminer les poids, un ensemble de tests constitué d'exemples différents de ceux de l'ensemble  ... 
doi:10.3166/ria.19.885-912 fatcat:lb4u7fzalbbobff2arljhlplme

Analyse syntaxique à l'aide des tables du Lexique-Grammaire du français

Elsa Tolone
2012 Lingvisticæ investigationes  
We describe the problems we encountered and the approaches we followed to enable their integration into a parser.LGExtractLGLexfffLexique des Formes Fléchies du FrançaisfffProduire des Annotations Syntaxiques  ...  Ceci constitue le problème du codage binaire. On peut tout de même noter que, pour un analyseur syntaxique, il est préférable de couvrir plus pour reconnaître même les phrases rares.  ...  Le but d'un analyseur syntaxique est de pouvoir construire la structure syntaxique d'une phrase donnée en entrée.  ... 
doi:10.1075/li.35.1.07tol fatcat:shno7slkavfehgrpja2reeleb4
« Previous Showing results 1 — 15 out of 159 results