Revisiting Node Affinity Prediction in Temporal Graphs
Mantri, Feldman, Eliasof et al.
Node affinity prediction is a common task that is widely used in temporal graph learning with applications in social and financial networks, recommender systems, and more. Recent works have addressed this task by adapting state-of-the-art dynamic link property prediction models to node affinity prediction. However, simple heuristics, such as Persistent Forecast or Moving Average, outperform these models. In this work, we analyze the challenges in training current Temporal Graph Neural Networks for node affinity prediction and suggest appropriate solutions. Combining the solutions, we develop NAViS - Node Affinity prediction model using Virtual State, by exploiting the equivalence between heuristics and state space models. While promising, training NAViS is non-trivial. Therefore, we further introduce a novel loss function for node affinity prediction. We evaluate NAViS on TGB and show that it outperforms the state-of-the-art, including heuristics. Our source code is available at https://github.com/orfeld415/NAVIS
academic
Revisiter la Prédiction d'Affinité de Nœuds dans les Graphes Temporels
La prédiction d'affinité de nœuds est une tâche importante dans l'apprentissage sur les graphes temporels, largement appliquée aux réseaux sociaux, réseaux financiers et systèmes de recommandation. Bien que les recherches récentes aient abordé la tâche de prédiction d'affinité de nœuds en adaptant les modèles de prédiction de liens dynamiques de pointe, des méthodes heuristiques simples (telles que la prédiction persistante et les moyennes mobiles) surpassent ces modèles complexes. Cet article analyse les défis d'entraînement des réseaux de neurones de graphes temporels actuels dans la tâche de prédiction d'affinité de nœuds et propose des solutions correspondantes. En combinant ces solutions, les auteurs ont développé NAVIS (Node Affinity prediction model using Virtual State), qui réalise la prédiction d'affinité de nœuds en exploitant l'équivalence entre les méthodes heuristiques et les modèles d'espace d'état.
La prédiction d'affinité de nœuds vise à prédire l'intensité d'interaction future d'un nœud avec tous les autres nœuds, ce qui diffère de la tâche traditionnelle de prédiction de liens. La prédiction de liens se concentre sur l'apparition d'une arête spécifique, tandis que la prédiction d'affinité nécessite un classement complet de tous les voisins potentiels, rendant la tâche plus difficile mais aussi plus proche des besoins pratiques.
Paradoxe de Performance: Les réseaux de neurones de graphes temporels (TGNNs) complexes fonctionnent moins bien que les méthodes heuristiques simples dans la tâche de prédiction d'affinité de nœuds
Limitations d'Expressivité: Les TGNNs existants ne peuvent pas représenter les opérations fondamentales telles que les moyennes mobiles
Inadéquation de la Fonction de Perte: La perte d'entropie croisée ne correspond pas à la nature de classement de la tâche d'affinité
Utilisation Insuffisante de l'Information: Les TGNNs n'exploitent pas pleinement les dynamiques temporelles globales et les dépendances à long terme
Les auteurs découvrent par analyse théorique que les méthodes heuristiques simples sont en réalité des cas particuliers de modèles d'espace d'état linéaires (SSMs), fournissant une base théorique pour concevoir des architectures TGNN plus puissantes.
Contribution Théorique: Démonstration que les méthodes heuristiques simples sont des cas particuliers des SSMs linéaires, et conception d'une architecture TGNN capable de généraliser les méthodes heuristiques basée sur cette connexion
Innovation Architecturale: Proposition du modèle NAVIS, combinant un état global virtuel et des mécanismes d'espace d'état linéaires, résolvant efficacement le problème de prédiction d'affinité de nœuds
Amélioration de la Fonction de Perte: Analyse des insuffisances de la perte d'entropie croisée dans la prédiction d'affinité, proposition d'une perte Lambda basée sur le classement comme alternative
Validation Expérimentale: Vérification de l'efficacité de la méthode sur les benchmarks TGB et plusieurs ensembles de données, surpassant systématiquement les méthodes existantes et les baselines heuristiques
Théorème 1 (Les SSMs linéaires généralisent les heuristiques fondamentales):
Soit H l'ensemble des heuristiques fondamentales (PF, SMA, EMA), et Flin-SSM l'ensemble des mappages réalisables par SSM linéaire, alors:
H⊊Flin-SSM
Théorème 2 (Limitations d'expressivité des RNN/LSTM/GRU):
Les unités RNN, LSTM ou GRU standard ne peuvent pas représenter l'heuristique de prédiction persistante (PF) la plus élémentaire, c'est-à-dire qu'il n'existe pas de paramètres pour tous les séquences d'entrée tels que hi=xi.
Analyse du Problème:
Théorème 3 (Sous-optimalité de l'entropie croisée pour le classement): Il existe une infinité de triplets (y,s1,s2) où rank(s1)=rank(y) et rank(s2)=rank(y), mais ℓCE(s1,y)>ℓCE(s2,y).
Solution: Adoption de la perte Lambda:
ℓLambda(s,y)=∑yi>yjlog2(1+e−σ(sπi−sπj)1)δij∣Aπi−Aπj∣
Combinée avec une régularisation de marge par paires:
ℓReg(s,y)=∑yi>yjmax(0,−(sπi−sπj)+Δ)
La recherche traditionnelle se concentre sur la capacité d'expression structurelle mesurée par le test WL, tandis que cet article se concentre sur la capacité d'expression fonctionnelle, c'est-à-dire la capacité à représenter des opérations mathématiques spécifiques.
Les recherches récentes ont découvert que les méthodes heuristiques simples surpassent les TGNNs complexes sur plusieurs benchmarks. Cet article exploite pour la première fois explicitement l'équivalence formelle entre les heuristiques et les SSMs pour concevoir une architecture.
Les méthodes existantes incluent les architectures basées sur la mémoire (TGN, DyRep) et sans mémoire (DyGFormer, GraphMixer), mais aucune ne peut traiter efficacement les besoins spécifiques de la prédiction d'affinité de nœuds.
Les insuffisances des TGNNs existants dans la prédiction d'affinité de nœuds proviennent des limitations d'expressivité et de l'inadéquation des objectifs d'entraînement
Les modèles d'espace d'état linéaires fournissent un cadre théorique pour généraliser les méthodes heuristiques
NAVIS résout efficacement le problème de prédiction d'affinité de nœuds en combinant un état global virtuel et une perte consciente du classement
Réseaux Financiers: Prédiction d'intensité de relations commerciales
Réseaux de Chaîne d'Approvisionnement: Prédiction de relations de collaboration
Évaluation Globale: Cet article est une recherche de haute qualité qui, par une analyse théorique approfondie, révèle les insuffisances des méthodes existantes et propose des solutions efficaces. Le modèle NAVIS est bien conçu, les résultats expérimentaux sont convaincants, et il apporte une contribution positive au domaine de l'apprentissage sur les graphes temporels. La valeur principale de l'article réside dans la fourniture d'une nouvelle perspective théorique et d'un cadre méthodologique pratique.