2025-11-14T22:58:11.335175

Revisiting Node Affinity Prediction in Temporal Graphs

Mantri, Feldman, Eliasof et al.
Node affinity prediction is a common task that is widely used in temporal graph learning with applications in social and financial networks, recommender systems, and more. Recent works have addressed this task by adapting state-of-the-art dynamic link property prediction models to node affinity prediction. However, simple heuristics, such as Persistent Forecast or Moving Average, outperform these models. In this work, we analyze the challenges in training current Temporal Graph Neural Networks for node affinity prediction and suggest appropriate solutions. Combining the solutions, we develop NAViS - Node Affinity prediction model using Virtual State, by exploiting the equivalence between heuristics and state space models. While promising, training NAViS is non-trivial. Therefore, we further introduce a novel loss function for node affinity prediction. We evaluate NAViS on TGB and show that it outperforms the state-of-the-art, including heuristics. Our source code is available at https://github.com/orfeld415/NAVIS
academic

Revisiter la Prédiction d'Affinité de Nœuds dans les Graphes Temporels

Informations Fondamentales

  • ID de l'article: 2510.06940
  • Titre: Revisiting Node Affinity Prediction in Temporal Graphs
  • Auteurs: Krishna Sri Ipsit Mantri, Or Feldman, Moshe Eliasof, Chaim Baskin
  • Classification: cs.LG (Apprentissage Automatique)
  • Statut de publication: Prépublication. En révision
  • Lien de l'article: https://arxiv.org/abs/2510.06940
  • Lien du code: https://github.com/orfeld415/NAVIS

Résumé

La prédiction d'affinité de nœuds est une tâche importante dans l'apprentissage sur les graphes temporels, largement appliquée aux réseaux sociaux, réseaux financiers et systèmes de recommandation. Bien que les recherches récentes aient abordé la tâche de prédiction d'affinité de nœuds en adaptant les modèles de prédiction de liens dynamiques de pointe, des méthodes heuristiques simples (telles que la prédiction persistante et les moyennes mobiles) surpassent ces modèles complexes. Cet article analyse les défis d'entraînement des réseaux de neurones de graphes temporels actuels dans la tâche de prédiction d'affinité de nœuds et propose des solutions correspondantes. En combinant ces solutions, les auteurs ont développé NAVIS (Node Affinity prediction model using Virtual State), qui réalise la prédiction d'affinité de nœuds en exploitant l'équivalence entre les méthodes heuristiques et les modèles d'espace d'état.

Contexte de Recherche et Motivation

Définition du Problème

La prédiction d'affinité de nœuds vise à prédire l'intensité d'interaction future d'un nœud avec tous les autres nœuds, ce qui diffère de la tâche traditionnelle de prédiction de liens. La prédiction de liens se concentre sur l'apparition d'une arête spécifique, tandis que la prédiction d'affinité nécessite un classement complet de tous les voisins potentiels, rendant la tâche plus difficile mais aussi plus proche des besoins pratiques.

Problèmes Fondamentaux

  1. Paradoxe de Performance: Les réseaux de neurones de graphes temporels (TGNNs) complexes fonctionnent moins bien que les méthodes heuristiques simples dans la tâche de prédiction d'affinité de nœuds
  2. Limitations d'Expressivité: Les TGNNs existants ne peuvent pas représenter les opérations fondamentales telles que les moyennes mobiles
  3. Inadéquation de la Fonction de Perte: La perte d'entropie croisée ne correspond pas à la nature de classement de la tâche d'affinité
  4. Utilisation Insuffisante de l'Information: Les TGNNs n'exploitent pas pleinement les dynamiques temporelles globales et les dépendances à long terme

Motivation de la Recherche

Les auteurs découvrent par analyse théorique que les méthodes heuristiques simples sont en réalité des cas particuliers de modèles d'espace d'état linéaires (SSMs), fournissant une base théorique pour concevoir des architectures TGNN plus puissantes.

Contributions Principales

  1. Contribution Théorique: Démonstration que les méthodes heuristiques simples sont des cas particuliers des SSMs linéaires, et conception d'une architecture TGNN capable de généraliser les méthodes heuristiques basée sur cette connexion
  2. Innovation Architecturale: Proposition du modèle NAVIS, combinant un état global virtuel et des mécanismes d'espace d'état linéaires, résolvant efficacement le problème de prédiction d'affinité de nœuds
  3. Amélioration de la Fonction de Perte: Analyse des insuffisances de la perte d'entropie croisée dans la prédiction d'affinité, proposition d'une perte Lambda basée sur le classement comme alternative
  4. Validation Expérimentale: Vérification de l'efficacité de la méthode sur les benchmarks TGB et plusieurs ensembles de données, surpassant systématiquement les méthodes existantes et les baselines heuristiques

Explication Détaillée de la Méthode

Définition de la Tâche

Étant donné un graphe dynamique en temps continu (CTDG): Gt={(uj,vj,τj,wj)}j=1J(t)G_t = \{(u_j, v_j, \tau_j, w_j)\}_{j=1}^{J(t)}

Pour un nœud de requête uVu \in V et un instant futur t+>tt^+ > t, l'objectif est de prédire le vecteur de scores d'affinité: s=Fθ(u,Gt,t+)RVs = F_\theta(u, G_t, t^+) \in \mathbb{R}^{|V|}

Fondements Théoriques

Théorème 1 (Les SSMs linéaires généralisent les heuristiques fondamentales): Soit HH l'ensemble des heuristiques fondamentales (PF, SMA, EMA), et Flin-SSMF_{\text{lin-SSM}} l'ensemble des mappages réalisables par SSM linéaire, alors: HFlin-SSMH \subsetneq F_{\text{lin-SSM}}

Théorème 2 (Limitations d'expressivité des RNN/LSTM/GRU): Les unités RNN, LSTM ou GRU standard ne peuvent pas représenter l'heuristique de prédiction persistante (PF) la plus élémentaire, c'est-à-dire qu'il n'existe pas de paramètres pour tous les séquences d'entrée tels que hi=xih_i = x_i.

Architecture du Modèle NAVIS

NAVIS utilise un mécanisme d'espace d'état linéaire pour maintenir l'état de chaque nœud hRdh \in \mathbb{R}^d et un état global virtuel gRdg \in \mathbb{R}^d:

zh = σ(Wxh*x + Whh*hi-1 + bh)
hi = zh ⊙ hi-1 + (1-zh) ⊙ x
zs = σ(Wxs*x + Whs*hi + Wgs*g + bs)  
s = zs ⊙ hi + (1-zs) ⊙ x

Où:

  • xx: vecteur d'affinité précédent
  • hi1,hih_{i-1}, h_i: état précédent et état mis à jour
  • gg: vecteur global virtuel
  • ss: vecteur d'affinité prédit
  • zh,zsz_h, z_s: mécanismes de gating adaptatif

Caractéristiques de Conception Clés

  1. Mécanisme de Mise à Jour Linéaire: Conserve la similarité conceptuelle avec l'EMA, mais permet un ajustement adaptatif à l'exécution
  2. État Global Virtuel: Capture les tendances globales en maintenant un tampon de vecteurs d'affinité récents
  3. Compatibilité avec le Mécanisme t-Batch: Ne dépend pas des états cachés des voisins, supportant le traitement par lots efficace
  4. Scalabilité: S'adapte aux graphes à grande échelle par sparsification du pipeline de prédiction d'affinité

Conception de la Fonction de Perte

Analyse du Problème: Théorème 3 (Sous-optimalité de l'entropie croisée pour le classement): Il existe une infinité de triplets (y,s1,s2)(y, s_1, s_2)rank(s1)=rank(y)\text{rank}(s_1) = \text{rank}(y) et rank(s2)rank(y)\text{rank}(s_2) \neq \text{rank}(y), mais CE(s1,y)>CE(s2,y)\ell_{CE}(s_1, y) > \ell_{CE}(s_2, y).

Solution: Adoption de la perte Lambda: Lambda(s,y)=yi>yjlog2(11+eσ(sπisπj))δijAπiAπj\ell_{\text{Lambda}}(s,y) = \sum_{y_i > y_j} \log_2\left(\frac{1}{1 + e^{-\sigma(s_{\pi_i} - s_{\pi_j})}}\right) \delta_{ij} |A_{\pi_i} - A_{\pi_j}|

Combinée avec une régularisation de marge par paires: Reg(s,y)=yi>yjmax(0,(sπisπj)+Δ)\ell_{\text{Reg}}(s,y) = \sum_{y_i > y_j} \max(0, -(s_{\pi_i} - s_{\pi_j}) + \Delta)

Configuration Expérimentale

Ensembles de Données

Ensembles de Données TGB:

  • tgbn-trade: Réseau de commerce agricole entre pays de l'ONU 1986-2016 (255 nœuds, 468 245 arêtes)
  • tgbn-genre: Réseau d'interactions utilisateur-genre musical (1 505 nœuds, 17 858 395 arêtes)
  • tgbn-reddit: Réseau d'interactions utilisateur-subreddit (11 766 nœuds, 27 174 118 arêtes)
  • tgbn-token: Réseau d'interactions portefeuille-jeton de cryptomonnaie (61 756 nœuds, 72 936 998 arêtes)

Ensembles de Données de Prédiction de Liens Convertis:

  • Wikipedia: Réseau d'interactions éditeur-article
  • Flights: Réseau de routes aériennes pendant la COVID-19
  • USLegis: Réseau de collaboration du Sénat américain
  • UNVote: Réseau de votes de l'Assemblée générale des Nations unies

Métriques d'Évaluation

  • Métrique Principale: NDCG@10 (Normalized Discounted Cumulative Gain)
  • Configuration Expérimentale: Division temporelle 70%-15%-15%, 50 epochs, taille de lot 200

Méthodes de Comparaison

  • Méthodes Heuristiques: Persistent Forecast, Moving Average, Historical Average
  • Méthodes TGNN: JODIE, TGAT, CAWN, TCL, GraphMixer, DyGFormer, DyRep, TGN, TGNv2

Résultats Expérimentaux

Résultats Principaux

Performance sur les Ensembles de Données TGB (NDCG@10):

  • tgbn-trade: NAVIS 0,863 vs meilleure baseline TGNv2 0,735 (+17,4%)
  • tgbn-genre: NAVIS 0,520 vs meilleure baseline TGNv2 0,469 (+10,9%)
  • tgbn-reddit: NAVIS 0,552 vs meilleure baseline TGNv2 0,507 (+8,9%)
  • tgbn-token: NAVIS 0,444 vs meilleure baseline TGNv2 0,294 (+51,0%)

Performance sur les Ensembles de Données Convertis:

  • Wikipedia: NAVIS 0,573 vs TGNv2 0,433 (+32,3%)
  • Flights: NAVIS 0,499 vs TGNv2 0,299 (+66,9%)
  • USLegis: NAVIS 0,347 vs TGNv2 0,253 (+37,2%)
  • UNVote: NAVIS 0,952 vs TGNv2 0,813 (+17,1%)

Études d'Ablation

Les études d'ablation valident l'importance de chaque composant:

  • Mise à Jour d'État Linéaire vs GRU: 0,863 vs 0,850 sur tgbn-trade
  • Inclusion du Vecteur Global: Amélioration d'environ 1-2 points de pourcentage
  • Perte de Classement vs Entropie Croisée: Amélioration significative de la performance

Découvertes Clés

  1. Confirmation de l'Avantage Heuristique: Les méthodes heuristiques simples surpassent effectivement les TGNNs complexes
  2. Importance de l'Information Globale: L'état global virtuel capture efficacement les tendances au niveau du réseau
  3. Correspondance de la Fonction de Perte: La perte consciente du classement est cruciale pour la prédiction d'affinité
  4. Amélioration Cohérente: NAVIS a obtenu des améliorations cohérentes sur tous les ensembles de données

Travaux Connexes

Capacité d'Expression des Graphes Temporels

La recherche traditionnelle se concentre sur la capacité d'expression structurelle mesurée par le test WL, tandis que cet article se concentre sur la capacité d'expression fonctionnelle, c'est-à-dire la capacité à représenter des opérations mathématiques spécifiques.

Méthodes Heuristiques et Modèles d'Espace d'État

Les recherches récentes ont découvert que les méthodes heuristiques simples surpassent les TGNNs complexes sur plusieurs benchmarks. Cet article exploite pour la première fois explicitement l'équivalence formelle entre les heuristiques et les SSMs pour concevoir une architecture.

Réseaux de Neurones de Graphes Temporels

Les méthodes existantes incluent les architectures basées sur la mémoire (TGN, DyRep) et sans mémoire (DyGFormer, GraphMixer), mais aucune ne peut traiter efficacement les besoins spécifiques de la prédiction d'affinité de nœuds.

Conclusions et Discussion

Conclusions Principales

  1. Les insuffisances des TGNNs existants dans la prédiction d'affinité de nœuds proviennent des limitations d'expressivité et de l'inadéquation des objectifs d'entraînement
  2. Les modèles d'espace d'état linéaires fournissent un cadre théorique pour généraliser les méthodes heuristiques
  3. NAVIS résout efficacement le problème de prédiction d'affinité de nœuds en combinant un état global virtuel et une perte consciente du classement

Limitations

  1. Modélisation de Dépendances Complexes: Difficultés persistantes à modéliser les relations multi-sauts complexes
  2. Scalabilité: La taille des paramètres croît linéairement avec le nombre de nœuds, nécessitant des stratégies de sparsification
  3. Complétude Théorique: Résolution incomplète de tous les problèmes connexes

Directions Futures

  1. Extension à la modélisation de dépendances temporelles plus complexes
  2. Amélioration de la scalabilité pour les graphes à grande échelle
  3. Exploration des possibilités des modèles d'espace d'état non linéaires

Évaluation Approfondie

Points Forts

  1. Contributions Théoriques Solides: Établissement rigoureux par preuves mathématiques du lien entre les méthodes heuristiques et les SSMs
  2. Analyse Approfondie du Problème: Analyse systématique des insuffisances des TGNNs dans la prédiction d'affinité de nœuds
  3. Conception Méthodologique Rationnelle: La conception de NAVIS repose sur des fondements théoriques clairs et des considérations pratiques
  4. Expériences Exhaustives: Expériences extensives sur plusieurs ensembles de données validant l'efficacité de la méthode
  5. Rédaction Claire: Structure d'article claire avec description précise des détails techniques

Insuffisances

  1. Degré d'Innovation Limité: Principalement l'application de théories existantes (SSMs) à un nouveau domaine problématique
  2. Configuration Expérimentale: Certains ensembles de données sont relativement petits, expériences à grande échelle limitées
  3. Équité de la Comparaison: Les comparaisons avec les méthodes de base peuvent présenter des différences d'implémentation
  4. Capacité de Généralisation: Nécessite une validation sur davantage de types de graphes différents

Impact

  1. Valeur Académique: Fournit une nouvelle perspective théorique pour l'apprentissage sur les graphes temporels
  2. Valeur Pratique: Valeur directe dans les applications pratiques telles que les systèmes de recommandation
  3. Reproductibilité: Implémentation de code complète fournie
  4. Caractère Inspirant: Fournit des idées précieuses pour les recherches ultérieures

Scénarios d'Application

  1. Systèmes de Recommandation: Prédiction d'affinité utilisateur-article
  2. Réseaux Sociaux: Prédiction d'intensité d'interaction utilisateur
  3. Réseaux Financiers: Prédiction d'intensité de relations commerciales
  4. Réseaux de Chaîne d'Approvisionnement: Prédiction de relations de collaboration

Évaluation Globale: Cet article est une recherche de haute qualité qui, par une analyse théorique approfondie, révèle les insuffisances des méthodes existantes et propose des solutions efficaces. Le modèle NAVIS est bien conçu, les résultats expérimentaux sont convaincants, et il apporte une contribution positive au domaine de l'apprentissage sur les graphes temporels. La valeur principale de l'article réside dans la fourniture d'une nouvelle perspective théorique et d'un cadre méthodologique pratique.