Filters








529 Hits in 6.0 sec

Accès mesurés aux sens

Pierre Zweigenbaum, Benoît Habert
2004 Mots: Les langages du politique  
Le regroupement peut reposer sur la classification hiérarchique (Lebart et autres, 1997, p. 155-176) : on obtient un arbre (dendrogramme) de mots.  ...  La question de la légitimité de leur utilisation pour des corpus relevant de la langue générale et non de domaines scientifiques ou techniques reste entière (Lespinasse, 2002) .  ...  Presentamos aquí tres grandes tipos de métodos que favorecen la obtención a este acceso y que se aplican tanto a los textos como a las palabras : recortar en unidades que transportan el sentido, particionar  ... 
doi:10.4000/mots.4673 fatcat:4uslpsxgdjgq3elv2halfbs52q

RFreeStem : Une méthode de racinisation indépendante de la langue et sans règle

Xavier Baril, Oihana Coustié, Josiane Mothe, Olivier Teste
2021 Revue ouverte d'ingénierie des systèmes d'information  
Ils ne mettent pas non plus nécessairement à disposition les racines extraites, pourtant requises pour certaines tâches de traitement de texte.  ...  La racine peut être une sous-chaîne ou une concaténation de sous-chaînes du mot, ou même une sous-chaîne modifiée, comme dans la méthode de Porter [Por80], qui dérive le mot happy en happi.  ...  données pour la Tâche 2 -2000 documents dans chaque cas  ... 
doi:10.21494/iste.op.2021.0605 fatcat:tv5qdjbj3bgovlwgqdumbbb64a

N˚ 1 - Méthode de repérage des thèses soutenues en 2014 et 2015 liées à la formation des adultes

Olivier Las Vergnas
2016 Savoirs  
Cette distance pourra servir à étudier des groupes de mots signifiants, et à en proposer des regroupements en utilisant des méthodes de classification hiérarchique (CH) ou d'analyse factorielle des correspondances  ...  Pour cela nous avons décidé de tester une seconde requête 6 (R2) dans le Sudoc portant sur « tous les mots » (i.e. dans le texte de la notice ou dans le texte intégral du résumé) et non pas seulement les  ... 
doi:10.3917/savo.041.0097 fatcat:ehkmooann5cebdd6mhjkd33byq

Vers un résumé automatique de séries télévisées basé sur une recherche multimodale d'histoires

Philippe Ercolessi, Christine Sénac, Hervé Bredin, Sandrine Mouysset
2012 Document Numérique  
MOTS-CLÉS : détection d'histoires, résumé de séries télévisées, classification spectrale, regroupement hiérarchique, multimodalité.  ...  A partir d'une segmentation des épisodes en scènes (présentant une unité de temps, d'action et de contenu sémantique), les histoires s'obtiennent en regroupant les scènes, non nécessairement contiguës,  ...  où un document textuel est constitué d'une suite de mots, un document vidéo peut être décrit comme une suite de plans, qui constituent donc notre unité de base d'un document vidéo.  ... 
doi:10.3166/dn.15.2.41-66 fatcat:ed2ilmbxprh7xiiwodrjc4zmpq

Intégration d'informations textuelles de haut niveau en analyse de structures de documents manuscrits non contraints

Florent Montreuil, Stéphane Nicolas, Laurent Heutte, Emmanuèle Grosicki
2011 Document Numérique  
Cet article décrit une nouvelle approche utilisant des champs aléatoires conditionnels (CAC) pour extraire à la fois la structure physique et la structure logique de documents manuscrits non contraints  ...  De bons résultats ont été obtenus montrant la capacité des approches CAC à extraire la mise en page d'un document complexe.  ...  Cependant, cet ensemble doit rester suffisamment petit pour ne pas perdre en précision et pour ne pas introduire des erreurs liées au regroupement de pixels normalement disjoints.  ... 
doi:10.3166/dn.14.2.77-101 fatcat:vxlbrb3mi5hqtiqjbcrxelfkli

A New Approach for Topic Detection using Adaptive Neural Networks [article]

Meriem Manai
2019 arXiv   pre-print
A second phase during which the construction and generation of vectors representing the documents was carried out. A third phase which is itself composed of two steps.  ...  Conclusion Durant le présent chapitre nous avons présenté notre nouvelle approche pour la détection de sujets basée sur les réseaux de neurones adaptatifs ART, intitulée ClusART.  ...  Dans le chapitre suivant, nous menons une étude expérimentale à travers laquelle nous allons conduire différentes expérimentations permettant d'évaluer les performances de notre approche pour la détection  ... 
arXiv:1903.03775v1 fatcat:c34harbnrjahtn6l6uv6q5bnie

Les espaces sémantiques de mots-clés : une méthode d'indexation automatique de documents par assignation de mots-clés

Jean-François Chartier, Dominic Forest
2017 Recherche d'information document et web sémantique  
Avec la croissance extrêmement rapide de la quantité de documents numériques dans nos sociétés, l'automatisation de l'indexation est devenue un enjeu de recherche central pour la gestion documentaire.  ...  d'assignation de mots-clés contrôlés qui sont absents du contenu textuel des documents.  ...  Dans la première, tel que discuté précédemment, l'opération de classification correspond à la fonction : ⟶ 1, 1 . Elle est une classification binaire, disjointe, d'un mot-clé candidat.  ... 
doi:10.21494/iste.op.2018.0206 fatcat:52eia5pl25gvlhgx4mlqzoccia

Recherche et analyse de l'information textuelle

Jacques Chaumier, Martine Dejean
2003 Documentaliste - Sciences de l'information  
de la licence souscrite par votre établissement.  ...  La reproduction ou représentation de cet article, notamment par photocopie, n'est autorisée que dans les limites des conditions générales d'utilisation du site ou, le cas échéant, des conditions générales  ...  La classification automatique est soit une classification supervisée, soit une classification non supervisée. Dans le premier cas, elle regroupe les éléments dans des classes prédéterminées.  ... 
doi:10.3917/docsi.401.0014 fatcat:pvnqiy6su5d7pn7jvabr6a3q7u

Epaisseur documentaire et numérisation : le cas des dossiers d'actualité dans la documentation de presse

Dominique Cotte
2002 Document Numérique  
Dans la documentation de presse, le dossier manuel remplit une fonction d'organisation de l'information qui n'est pas facilement substituable par la logique informatique.  ...  Répondant à un besoin particulier d'organiser l'information par thèmes plus que par mots-clés, la logique documentaire pourrait rencontrer la logique d'évolution des outils informatiques, lesquels s'orientent  ...  De toutes les façons, il s'agissait d'un problème concernant le gestionnaire du système et non pas l'utilisateur pour lequel ce stockage par regroupement est de toutes les façons invisible et impalpable  ... 
doi:10.3166/dn.6.1-2.13-28 fatcat:l4wwgz7njvdcnmtf2uu3dsfcky

Représentation vectorielle de documents pour l'indexation de notices bibliographiques

Morgane Marchand, Geoffroy Fouquier, Emmanuel Marchand, Guillaume Pitel
2017 Recherche d'information document et web sémantique  
La première approche cherche dans le titre et le résumé du document des mots graphiquement proches des mots-clefs du thésaurus.  ...  Cet article présente la contribution d'eXenSa à l'édition 2016 du DÉfi Fouille de Textes (DEFT) dont la tâche consiste à indexer des documents scientifiques par des mots-clefs, préalablement sélectionnés  ...  pour les matrices document-mots.  ... 
doi:10.21494/iste.op.2018.0208 fatcat:46mxwobr3fbmziccbvknmssxiq

Marchés et allotissement : regroupement ou dégroupement ?

Olivier Compte, Laurent Lamy, Emmanuel Laurent, Emmanuel Laurent
2017 Revue économique  
On s'intéresse à la question de l'allotissement optimal, du point de vue du vendeur (ou du maître d'oeuvre), en se focalisant sur l'effet de regrouper plusieurs lots en un seul, ou inversement, de dégrouper  ...  Classification JEL : D44.  ...  La question pour le vendeur consiste à définir des lots constitués d'un ensemble de mots-clés, ou éventuellement d'un ensemble pondéré de mots-clés.  ... 
doi:10.3917/reco.pr2.0075 fatcat:sltljs7hlvcdbo7iv54n3vvclm

Haruspex, Outil de Gestion de Connaissances non Structurées

Matthieu Quantin, Benjamin Hervy, Florent Laroche, Jean-Louis Kerouanton
2017 Archéologies numériques  
Indexation sémantique de ce corpus: extraction de mots clés (génériques mais aussi très spécifiques), puis classification de ces mot-clés en catégories (si possible). 3.  ...  L'objet de cette communication est de proposer une méthode pour l'analyse et l'exploitation de corpus de documents non-structurés ou faiblement structurés.  ...  des musées (avec des corpus restreints de textes non-structurés et des besoins de précision pour l'analyse).  ... 
doi:10.21494/iste.op.2017.0172 fatcat:wvoe7tfwkra5zijbshey4xb7gu

Méthodologie de transformation d'un thesaurus en une ontologie de domaine

Claude Chrisment, Ollivier Haemmerlé, Nathalie Hernandez, Josianne Mothe
2008 Revue d'intelligence artificielle : Revue des Sciences et Technologies de l'Information  
Un corpus de référence est en outre utilisé pour compléter la connaissance représentée.  ...  Les techniques de recherche d'information s'appuient sur l'extraction de termes dans les documents, termes qui servent de base pour l'accès à ces documents.  ...  Nous remercions également Didier Bourigault pour l'utilisation des logiciels qu'il a conçus .  ... 
doi:10.3166/ria.22.7-37 fatcat:uz332l2mpzaffahlwtvmekxqha

Détection de signaux faibles dans des masses de données faiblement structurées

Julien Maitre, Michel Menard, Guillaume Chiron, Alain Bouju
2019 Recherche d'information document et web sémantique  
MOTS-CLÉS : Modèle de thèmes, Plongement de mots, LDA, Word2Vec, regroupement.  ...  Nous supposons que chaque document est un mélange d'un petit nombre de thèmes ou catégories, et que la création de chaque mot est attribuable en termes de probabilités à l'un des thèmes du document.  ...  Un nouvel outil de classification non supervisée de documents pour la découverte de connaissances et la détection de signaux faibles : RARES Text TM .  ... 
doi:10.21494/iste.op.2020.0463 fatcat:2aabrvdlhjc5fhlsjsep7cbndm

Normes et fontes

Daniel Dardailler
1989 Cahiers GUTenberg  
On verra que des noms de polices jusqu'aux types de courbes mathtmatiques utilisées pour représenter les images des lettres, il existe un besoin pressant de normalisation pour rendre les processus de création  ...  et d'échange de documents moins complexes qu'ils ne le sont actuellement.  ...  La liste des exemples de problèmes liés à la présence d'une multitude de normes différentes est bien longue et le seul fait, pour les auteurs, d'hésiter à chaque fois entre le mot police ou le mot fonte  ... 
doi:10.5802/cg.41 fatcat:co7ok6obajaavdoob7jz3vdere
« Previous Showing results 1 — 15 out of 529 results