L'utilisation de schémas de discours pour améliorer la pertinence et la cohérence discursive dans le cadre du résumé automatique de blogs

Shamima Mithun, Leila Kosseim
2012 Document Numérique  
Les collections de ressources numériques peuvent être exploitées dans un cadre éducatif, par exemple comme stimuli dans des questions de test ou comme des illustrations dans des objets pédagogiques. De nombreux détenteurs de collections de ressources média affichent de plus en plus l'ambition que leurs ressources soient utilisées dans un contexte éducatif. Néanmoins, les métadonnées associées à ces ressources ne sont souvent pas directement utilisables comme critères de sélection. Des extraits
more » ... e romans ou des articles de l'actualité économique, s'ils ne sont pas des ressources pédagogiques en eux-mêmes présentent des caractéristiques qui les rendent plus ou moins intéressants et accessibles pour un profil d'apprenant et dans un contexte pédagogique particulier. Nous présentons dans cet article les mesures de difficulté des textes qui peuvent permettre d'annoter une collection et de qualifier le contexte pédagogique dans lequel elle pourra être valorisée. Nous avons mis en oeuvre des mesures statistiques, syntaxiques et sémantiques dans un système unique afin d'opérer des combinaisons en fonction de l'importance relative que chaque mesure doit avoir dans un contexte et pour un type de texte particuliers. Nous avons utilisé une approche classique basée sur des calculs statistiques, ainsi qu'une approche de web mining et des technologies sémantiques. Nous avons testé le système avec des jeux de données précalibrés. Nous montrons les possibilités offertes par un outil ouvert pour l'évaluation de la réutilisabilité des collections de ressources multimédias dans un environnement éducatif.
doi:10.3166/dn.15.3.119-142 fatcat:fjirlplwj5fdlcjsebk7pikiky