Filters








213 Hits in 14.3 sec

Web pages segmentation for document selection in Question Answering (Pré-segmentation de pages web et sélection de documents pertinents en Questions-Réponses) [in French]

Nicolas Foucault, Sophie Rosset, Gilles Adda
2013 Traitement Automatique des Langues Naturelles & Rencontre des Étudiants Chercheurs en Informatique pour le Traitement Automatique des Langues  
L'une segmente les textes extraits des pages web uniformément en blocs de taille fixe, l'autre les segmente par TextTiling (Hearst, 1997) en blocs thématiques de taille variable.  ...  Dans cet article, nous présentons une méthode de segmentation de pages web en blocs de texte pour la sélection de documents pertinents en questions-réponses.  ...  conduit à une augmentation des performances d'un moteur de recherche dans sa tâche.  ... 
dblp:conf/taln/FoucaultRA13 fatcat:zbahlryqwreexa3j6opaxfullm

Indexation automatique de documents par combinaison d'analyses statistiques et terminologiques structurées

Lyne Da Sylva
2004 Open research Areas in Information Retrieval  
Ce travail vise à développer un certain type d'outil de navigation de documents numériques pour faciliter la recherche d'information, sous la forme d'un index comme ceux que l'on retrouve à la fin des  ...  De plus, les moteurs de recherche n'indexent généralement pas les pages au complet, se limitant à un certain nombre de kilo-octets au début du document.  ...  Le système découpe ensuite le texte en segments (unités thématiques, ou UT) sur la base de la cohésion lexicale : une phrase est incluse dans le segment courant si elle partage des mots avec un nombre  ... 
dblp:conf/riao/Sylva04 fatcat:7kiktevsabhmheg6mzc2icsb2u

Un résumeur à base de graphes, indépéndant de la langue [article]

Juan-Manuel Torres-Moreno, Javier Ramirez, Iria da Cunha
2015 arXiv   pre-print
The algorithm maps a document as a graph, then it computes the weight of their sentences. We have applied this approach to summarize documents in three languages.  ...  Ces algorithmes peuvent être vus comme les éléments clés du paradigme amorcé dans le domaine de la recherche sur Internet, à savoir le classement des pages Web par l'analyse de leurs positions dans le  ...  Des tests effectués ont montré que notre algorithme est efficace pour la recherche de segments pertinents.  ... 
arXiv:1501.01243v1 fatcat:hfp3cjerizdovh4owkahez35la

Application d'algorithmes de classification automatique pour la détection des contenus racistes sur l'Internet

Romain Vinot, Natalia Grabar, Mathieu Valette
2003 Traitement Automatique des Langues Naturelles & Rencontre des Étudiants Chercheurs en Informatique pour le Traitement Automatique des Langues  
Nous présentons une évaluation de ces techniques pour le filtrage de contenus racistes.  ...  Le filtrage de contenus illicites sur Internet est une problématique difficile qui est actuellement résolue par des approches à base de listes noires et de mots-clés.  ...  La majorité des systèmes proposés utilisent néanmoins les classifieurs lexicaux standards et obtiennent des performances peu satisfaisantes.  ... 
dblp:conf/taln/VinotGV03 fatcat:vhbdxljaxnfdtnsznxizpojkb4

Résumé automatique guidé de textes: État de l'art et perspectives (Guided Summarization : State-of-the-art and perspectives )

Salima Lamsiyah, Said Ouatik El Alaoui, Bernard Espinasse
2018 Traitement Automatique des Langues Naturelles & Rencontre des Étudiants Chercheurs en Informatique pour le Traitement Automatique des Langues  
Les systèmes de résumé automatique de textes (SRAT) consistent à produire une représentation condensée et pertinente à partir d'un ou de plusieurs documents textuels.  ...  , et leurs évaluations sur des corpus de références.  ...  et de textes littéraires, résumé des pages web, résumé des conversations email, etc.  ... 
dblp:conf/taln/LamsiyahAE18 fatcat:qibmbtjlgfch7pu2uz4pkefy44

Résumé automatique multi-document et indépendance de la langue : une première évaluation en français

Florian Boudin, Juan-Manuel Torres-Moreno
2009 Traitement Automatique des Langues Naturelles & Rencontre des Étudiants Chercheurs en Informatique pour le Traitement Automatique des Langues  
Le résumé automatique de texte est une problématique difficile, fortement dépendante de la langue et qui peut nécessiter un ensemble de données d'apprentissage conséquent.  ...  (Mihalcea, 2004) a démontré l'intérêt des approches à base de graphes pour l'extraction de segments de texte importants.  ...  Les auteurs remercient Claude de Loupy, Christelle Ayache et Somara Seng pour avoir rendu l'évaluation de notre approche possible.  ... 
dblp:conf/taln/BoudinT09 fatcat:q4fl32kt5fafdhykbu5i7jft4u

Notes de lecture

2003 Documentaliste - Sciences de l'information  
Il est précisé que son stockage dans une base de données est également interdit. Powered by TCPDF (www.tcpdf.org) Document téléchargé depuis www.cairn.info ---207.241.229.  ...  La reproduction ou représentation de cet article, notamment par photocopie, n'est autorisée que dans les limites des conditions générales d'utilisation du site ou, le cas échéant, des conditions générales  ...  Par la suite, est discuté un modèle de recherche distribuée de l'information. Le chapitre se ferme sur une revue des véritables systèmes de métarecherche sur le web.  ... 
doi:10.3917/docsi.406.0401 fatcat:x5npxizlmbd3najsoxvtgcr7oe

From opinion classification to recommendations: How texts from a social network can help

Damien Poirier, Françoise Fessant, Isabelle Tellier
2010 Revue TAL  
Cet article s'intéresse à la classification d'opinions de textes communautaires par apprentissage supervisé, en vue de les utiliser pour un système de recommandation.  ...  Finally, we evaluate the best classifier with a recommender system based on collaborative filtering.  ...  De plus, le bon fonctionnement d'un tel système et sa performance reposent sur une grande quantité d'information.  ... 
dblp:journals/tal/PoirierFT10 fatcat:3sya7juz75hx7lcecyo4pubjzm

Sémantique des textes et Recherche d'Information

Mathieu Valette, Monique Slodzian
2008 Revue Française de Linguistique Appliquée  
Recherche d'Information  ...  Mathieu Valette, Monique Slodzian (2008) « Sémantique des textes et Recherche d'information », Extraction d'information : l'apport de la linguistique, A. Condamines & Th.  ...  Forces et faiblesses de la classification automatique Dans Vinot et al. (2003), une expérience de classification sur corpus a été menée pour évaluer les performances de trois algorithmes de classification  ... 
doi:10.3917/rfla.131.0119 fatcat:uunwq7ojsbcwzi4ll6icz3s64y

A New Approach for Topic Detection using Adaptive Neural Networks [article]

Meriem Manai
2019 arXiv   pre-print
In the first step we used the FuzzyART algorithm for the training phase. In the second step we used a classifier using Paragraph Vector for the test phase.  ...  Dans le chapitre suivant, nous menons une étude expérimentale à travers laquelle nous allons conduire différentes expérimentations permettant d'évaluer les performances de notre approche pour la détection  ...  de sujets.  ... 
arXiv:1903.03775v1 fatcat:c34harbnrjahtn6l6uv6q5bnie

Résumé Automatique Multi-Document Dynamique : État de l'Art

Maali Mnasri
2015 Traitement Automatique des Langues Naturelles & Rencontre des Étudiants Chercheurs en Informatique pour le Traitement Automatique des Langues  
Nous montrons ensuite que la performance des systèmes de résumé multi-document et dynamique est encore modeste.  ...  Nous essayons de déceler les insuffisances des systèmes existants afin de bien définir notre problématique et guider ainsi nos prochains travaux.  ...  PageRank est un algorithme de classement utilisé par le moteur de recherche de Google. Il représente les pages Web par les sommets d'un graphe et les liens par les arcs.  ... 
dblp:conf/taln/Mnasri15 fatcat:6izbsexvuzb4dktefqhpfj6eba

L'amélioration du reciblage par les Big Data : une aide à la décision qui menace l'image des marques ?

Maria Mercanti-Guérin
2013 Revue internationale d intelligence économique  
Néanmoins, malgré le nombre croissant d'investisseurs dans ce secteur, très peu de recherches académiques sont consacrées au sujet.  ...  Le retargeting est une technologie innovante fondée sur les Big Data.  ...  Pour McKinsey, les Big Data du fait de leur gigantisme vont au-delà des capacités d'analyse des systèmes d'information.  ... 
doi:10.3166/r2ie.5.153-165 fatcat:62degaumrrdjbifvzzrupgxzki

Détection de signaux faibles dans des masses de données faiblement structurées

Julien Maitre, Michel Menard, Guillaume Chiron, Alain Bouju
2019 Recherche d'information document et web sémantique  
Nous supposons que chaque document est un mélange d'un petit nombre de thèmes ou catégories, et que la création de chaque mot est attribuable en termes de probabilités à l'un des thèmes du document.  ...  Cet article se focalise principalement sur la recherche de signaux faibles présents dans les documents.  ...  La famille des algorithmes LDA n'échappe pas à cette difficulté et il est souvent proposé une mise en oeuvre de l'algorithme avec un nombre de clusters recherchés très important, suivi d'une évaluation  ... 
doi:10.21494/iste.op.2020.0463 fatcat:2aabrvdlhjc5fhlsjsep7cbndm

Classification d'un contenu encyclopédique en vue d'un étiquetage par entités nommées

Eric Charton, Juan-Manuel Torres-Moreno
2009 Traitement Automatique des Langues Naturelles & Rencontre des Étudiants Chercheurs en Informatique pour le Traitement Automatique des Langues  
On utilise souvent des ressources lexicales externes pour améliorer les performances des systèmes d'étiquetage d'entités nommées.  ...  Dans cet article nous explorons cette difficulté et proposons un système complet de transformation d'un arbre taxonomique encyclopédique en une système à classe sémantiques adapté à l'étiquetage d'entités  ...  Par ailleurs, de nouvelles tâches d'extraction d'information ouvertes au cours des deux dernières années peuvent imposer l'usage d'un étiquetage adapté à une thématique particulière : c'est le cas pour  ... 
dblp:conf/taln/ChartonT09 fatcat:4opawa36mjeyjiygiv7hfmoyda

Chapitre 8. Broadcast ou viralité ? [chapter]

Franck Ghitalla
2021 Qu'est-ce que la cartographie du web ?  
Il a contribué à créer le logiciel d'analyse de réseaux Gephi et l'outil de fouille du Web Hyphe. Il twitte à @jacomyma et publie un carnet de recherche anglophone sur reticular. hypotheses.org.  ...  du Web puis sur les propagations).  ...  domaines connexes de la recherche dans la carte générale des savoirs).  ... 
doi:10.4000/books.oep.15478 fatcat:7h4f5cdcpbew3hsx36tyxo7coe
« Previous Showing results 1 — 15 out of 213 results