Building a knowledge base using Microblogs: the case of festivals and location-based events

Hoang Thi, Bich Ngoc, Josiane Mothe
unpublished
Les médias sociaux comme twitter sont très utilisés lors d'un évènement (conférence, catastrophe, évènement culturel...) pour collaborativement commenter ou donner des avis sur son déroulement. Les utilisateurs du réseau social sont alors avertis via les personnes qu'ils suivent ou en recherchant les tweets portant sur l'évènement. Cependant compte tenu de la taille d'un tweet, l'information obtenue par un seul post est souvent très partielle. L'utilisation d'un ensemble de tweets sur un
more » ... weets sur un évènement peut permettre d'avoir une vue plus complète en combinant toutes les informations postées. Dans cet article, nous proposons un modèle de re-présentation d'une collection de microblogs basé sur une ontologie de domaine. Nous indiquons également comment populer cette ontologie en se basant à la fois sur la collection de tweets mais également sur des collections externes. Nous appliquons notre modèle au cas des tweets sur les festivals (collection issue du challenge CLEF 2016) et montrons comment il pourra être utilisé pour faire des recommendations. ABSTRACT. Social media like Twitter are used during an event (catastrophe, cultural events ...) to collaboratively comment or advise on that event. Social network users are then notified through the people they follow or by seeking tweets related to the event. However, given the size of a tweet, the information obtained by a single post is often very partial. Using a set of tweets about an event makes it possible to have a more complete view by combining all the information posted. In this paper, we propose a model to represent a collection of micro-blogs based on a domain ontology. We also show how to populate this ontology based on both the collection of tweets and external collections. We apply our model to the case of tweets on festivals (a collection of the CLEF 2016 challenge) and show how it can be used to make recommendations. MOTS-CLÉS : Base de connaissance de domaine, Microblog, Extraction d'information à partir de tweets.
fatcat:z5lkptpopjcuznj6uwmft22q2a