Apprentissage de représentations pour la modélisation de processus de diffusion dans les réseaux sociaux

Simon Bourigault, Sylvain Lamprier, Patrick Gallinari
2016 Document Numérique  
To cite this version: Simon Bourigault. Apprentissage de représentations pour la prédiction de propagation d'information dans les réseaux sociaux. Intelligence artificielle [cs.AI]. Université Pierre et Marie Curie -Paris VI, 2016. Français. NNT : 2016PA066368. tel-01481311 Remerciements Je tiensà remercier, dans le désordre : Mes encadrants, messieurs Lamprier et Gallinari pour leur accompagnement et leurs conseils au cours de ces quatre années de travail, ainsi que pour tous leurs retours
more » ... nt la rédaction du présent manuscrit. Les rapporteurs pour leurs remarques sur la première version du manuscrit, ainsi que l'ensemble du jury. L'équipe MLIA et mes collègues thésards en particulier pour l'atmosphère de travail au sein du laboratoire. L'ensemble du personnel administratif et technique du laboratoire, sans qui aucune recherche ne pourrait avoir lieu. Mes parents, pour leur soutien et leur présence tout au long de mesétudes dont ce manuscrit constitue aujourd'hui l'aboutissement. Ma compagne ainsi que mes amis et anciens camarades de master, pour tout. paramétrée permettant d'obtenir une représentation du contenu dans R d 1.3. Projection des utilisateurs 1.5. Contributions diffusion d'information :état de l'art Résumé Ce chapitre présente unétat de l'art sur la prédiction de diffusion dans les réseaux sociaux. Nousétudions plusieurs approches correspondantà des contextes variés età des tâches différentes. Nous nous intéressonségalementà quelques problématiques annexes liéesà la prédiction de diffusion : la maximisation d'influence, l'identification de leaders d'opinion et la détection de source. Les valeurs de p et de q ontété mesuréesà p = 0.03 et q = 0.38 en moyenne sur plusieurs centaines de courbes d'adoptions observées sur de vraies campagnes marketing [Mahajan et al., 1995], un résultat montrant l'importance de la diffusion inter-utilisateurs. 2.3.1.1 Extensions Le modèle de Bass peutêtre appliquéà la diffusion d'information sur les réseaux sociaux, soit dans sa forme de base [Luu et al., 2012], soit dans une versionétendue prenant en compte davantage de paramètres. En particulier, le modèle se base sur la loi d'action de masse, c'està dire que chaque utilisateur est susceptible d'influencer tous les autres. Dans [ Luu et al., 2012] , les auteurs observent qu'en pratique, la diffusion ne se fait pas dans un graphe complet, et que l'effet du bouche-à-oreille dépend donc de la distribution des degrés dans le graphe social. Ils proposent les extensions Scale-free network Linear Influence Model (SLIM) et Exponential network Linear Influence Model (ELIM), modélisant la diffusion dans une population où la répartition des degrés dans le graphe social suit une loi de puissance ou une loi exponentielle, respectivement. L'équation devient : où E d (i(t)) désigne le nombre moyen de voisins ayant adopté le produit pour les utilisateurs non infectés. Sa valeur dépend de la répartition des degrés et de i(t). Dans [Lerman and Hogg, 2010] , les auteurs s'intéressent au site internet Digg et intègrent dans le modèle de Bass plusieurs paramètres très spécifiquesà l'organisation de ce site, ce qui permet une modélisation plus précise : nombre moyens de visites du site, répartition des informations sur différentes pages, etc. Modèlesépidémiologiques Des modèles suivant la même idée ontégalementété proposés pour modéliser et expliquer la diffusion d'une maladie au sein d'une population [Daley et al., 2001] . Dans ces modèles, chaque utilisateur se trouve dans unétat. A chaque instant, il peut changer d'état, suivant des probabilités dépendant du modèle.
doi:10.3166/dn.19.2-3.31-52 fatcat:6m3vkvfuazhyhl4ekpdvznp57u