Graph clustering and semi-supervised learning of non-binary, temporal and geometric networks - INRIA - Institut National de Recherche en Informatique et en Automatique Accéder directement au contenu
Thèse Année : 2022

Graph clustering and semi-supervised learning of non-binary, temporal and geometric networks

Détection de communautés et apprentissage semi-supervisé dans des réseaux non-binaires, temporels et géométriques

Résumé

The massive explosion of data collection led to a multi-disciplinary interest in the statistical inference of complex systems. In these systems, agents interact by pairs. Since similar agents tend to interact similarly, an important unsupervised learning problem consists of grouping the agents into communities or clusters based on the pairwise interactions. This thesis explore various aspects of this learning task.In particular, we study random graph models in which each node belong to a community (also called block) and the interactions between node pairs depend on the community structure. For those stochastic block models, we establish consistency thresholds for community recovery. These results allow for non-binary interactions, such as weighted, temporal or multiplex networks. In particular, it shows that in temporal networks with Markov interactions, consistent recovery of communities can be achieved for very sparse interactions, provided that the number of snapshots is large enough.We propose several algorithms for clustering temporal networks, such as spectral methods based on the persisting edges, or methods based on an online computation of the likelihood.We also study graph clustering in a semi-supervised setting. In this setting, an oracle provides the community memberships of a few nodes. This extra information helps to recover the community labels of the rest of the nodes.Finally, we investigate networks in which the nodes have a position in a metric space. In such geometric networks, we show that standard spectral methods (such as Spectral Clustering) fail at recovering the communities. We propose and analyze a spectral algorithm based on a higher-order eigenvector.
La multiplication des données collectées a occasionné un intérêt multi-disciplinaire autour de l'étude statistique de systèmes complexes où les individus interagissent en pairs. Dans de tels réseaux, des individus similaires ont tendance à interagir similairement. Un important problème d'inférence statistique consiste donc à regrouper les individus similaires en communautés (aussi appelées clusters) en se basant uniquement sur l'observation des interactions entre individus. Ce problème d'apprentissage non-supervisé qui consiste à placer chaque nœud dans un groupe est appelé détection des communautés. Cette thèse a pour but d'étudier différents aspects de la détection de communauté dans des systèmes complexes.En particulier, nous étudions des modèles de graphes aléatoires où chaque nœud appartient à une communauté (aussi appelé bloc) et où l'interaction entre deux nœuds dépend uniquement des blocs dans lesquels ces deux nœuds appartiennent. Pour ces modèles, nous établissons des résultats théoriques sur la possibilité et l'impossibilité de découverte des communautés. Notre étude autorise des interactions quelconques (non nécessairement binaires), ce qui rend le résultat applicable à de nombreuses situations (interaction pondérées, temporelles, multi-couches, etc.). Dans le cas particulier d'un réseau temporel où les interactions sont markoviennes, nous montrons que si le nombre d'instants temporels est assez large, les communautés peuvent être estimées de manière consistante même lorsque les interactions sont très diluées.Dans le cas particulier où les interactions entre les nœuds varient au cours du temps, nous proposons plusieurs algorithmes. Plus précisément, nous présentons des méthodes spectrales utilisant les interactions persistantes ou des méthodes basées sur un calcul itératif de la vraisemblance.Nous examinons aussi le problème de la détection semi-supervisées des communauté. Dans ce cas, un oracle nous renseigne sur la communauté d'un petit nombre de nœuds. Ces renseignements s'ajoutent aux interactions observées entre les nœuds, et facilitent le problème initial (l'apprentissage des communautés des nœuds).Enfin, nous étudions la situation où les nœuds sont positionnés dans un espace métrique. Dans ce cas, nous montrons que les méthodes spectrales classiques (telles que Spectral Clustering) peuvent totalement échouer, et nous analysons une parade basée sur la sélection de vecteurs propres d'ordre supérieur.
Fichier principal
Vignette du fichier
2022COAZ4011.pdf (4.87 Mo) Télécharger le fichier
Origine : Version validée par le jury (STAR)

Dates et versions

tel-03667090 , version 1 (13-05-2022)

Identifiants

  • HAL Id : tel-03667090 , version 1

Citer

Maximilien Dreveton. Graph clustering and semi-supervised learning of non-binary, temporal and geometric networks. Artificial Intelligence [cs.AI]. Université Côte d'Azur, 2022. English. ⟨NNT : 2022COAZ4011⟩. ⟨tel-03667090⟩
180 Consultations
117 Téléchargements

Partager

Gmail Facebook X LinkedIn More