SOCLE : Vers un cadre de préparation des données dans les applications sociales

Sihem Amer-Yahia, Noah Ibrahim, Christian Kamdem Kengine, Federico Ulliana, Marie-Christine Rousset
2014 Ingénierie des Systèmes d'Information  
The web has evolved from a technological platform to a real social milieu thereby becoming a continuous source of Big Social Data (BSD). BSD is characterized by a combination of factual content such as the coordinates of a restaurant, the content of a webpage or the title of a movie, behavior data such as exchanges between social relationships, as well as subjective data such as users' opinions, reviews, and tags. The goal of a social application is to analyze BSD and process it in order to
more » ... rstand it and transform it into valuable content to users. Building social applications requires an essential data preparation step during which raw BSD is sanitized, normalized, enriched, pruned, and transformed making it readily available for further processing. We argue for the need to formalize data preparation and develop appropriate tools to enable easy prototyping of social applications. We describe SOCLE, our framework for BSD preparation. We provide an architecture inspired from typical social applications, the state of the art of existing languages and algebras for manipulating BSD, and the scientific challenges and opportunities underlying the development of SOCLE. RÉSUMÉ. Le web, initialement une plateforme technologique, est devenu un véritable éco-système social et une source continue de Big Data sociales (BSD). Nous y trouvons des données factuelles et objectives telles que les coordonnées d'un restaurant, des données comportementales telles que les échanges entre amis et enfin, des données subjectives comme les revues, les étiquettes, les notes ou les étoiles. Ces données brutes ont besoin d'être filtrées et organisées pour en extraire des informations utiles et permettre le développement d'applications sociales qui apportent une valeur ajoutée aux utilisateurs. Dans cet article, nous motivons le besoin de formaliser l'étape de préparation des BSD et décrivons SOCLE, notre plateforme pour le faire. Nous présentons une architecture inspirée d'applications sociales types, un état de l'art des langages et algèbres existants et les défis scientifiques du développement de SOCLE. Ingénierie des systèmes d'information -n o issue/2014, 1-24 2 ISI. Volume volume -n o issue/2014
doi:10.3166/isi.19.3.49-72 fatcat:wynnr47anngi5ovpalm7s3v5ye