2025-11-14T22:58:11.335175

Revisiting Node Affinity Prediction in Temporal Graphs

Mantri, Feldman, Eliasof et al.

Node affinity prediction is a common task that is widely used in temporal graph learning with applications in social and financial networks, recommender systems, and more. Recent works have addressed this task by adapting state-of-the-art dynamic link property prediction models to node affinity prediction. However, simple heuristics, such as Persistent Forecast or Moving Average, outperform these models. In this work, we analyze the challenges in training current Temporal Graph Neural Networks for node affinity prediction and suggest appropriate solutions. Combining the solutions, we develop NAViS - Node Affinity prediction model using Virtual State, by exploiting the equivalence between heuristics and state space models. While promising, training NAViS is non-trivial. Therefore, we further introduce a novel loss function for node affinity prediction. We evaluate NAViS on TGB and show that it outperforms the state-of-the-art, including heuristics. Our source code is available at https://github.com/orfeld415/NAVIS

academic

Revisiter la Prédiction d'Affinité de Nœuds dans les Graphes Temporels

Informations Fondamentales

ID de l'article: 2510.06940
Titre: Revisiting Node Affinity Prediction in Temporal Graphs
Auteurs: Krishna Sri Ipsit Mantri, Or Feldman, Moshe Eliasof, Chaim Baskin
Classification: cs.LG (Apprentissage Automatique)
Statut de publication: Prépublication. En révision
Lien de l'article: https://arxiv.org/abs/2510.06940
Lien du code: https://github.com/orfeld415/NAVIS

Résumé

La prédiction d'affinité de nœuds est une tâche importante dans l'apprentissage sur les graphes temporels, largement appliquée aux réseaux sociaux, réseaux financiers et systèmes de recommandation. Bien que les recherches récentes aient abordé la tâche de prédiction d'affinité de nœuds en adaptant les modèles de prédiction de liens dynamiques de pointe, des méthodes heuristiques simples (telles que la prédiction persistante et les moyennes mobiles) surpassent ces modèles complexes. Cet article analyse les défis d'entraînement des réseaux de neurones de graphes temporels actuels dans la tâche de prédiction d'affinité de nœuds et propose des solutions correspondantes. En combinant ces solutions, les auteurs ont développé NAVIS (Node Affinity prediction model using Virtual State), qui réalise la prédiction d'affinité de nœuds en exploitant l'équivalence entre les méthodes heuristiques et les modèles d'espace d'état.

Contexte de Recherche et Motivation

Définition du Problème

La prédiction d'affinité de nœuds vise à prédire l'intensité d'interaction future d'un nœud avec tous les autres nœuds, ce qui diffère de la tâche traditionnelle de prédiction de liens. La prédiction de liens se concentre sur l'apparition d'une arête spécifique, tandis que la prédiction d'affinité nécessite un classement complet de tous les voisins potentiels, rendant la tâche plus difficile mais aussi plus proche des besoins pratiques.

Problèmes Fondamentaux

Paradoxe de Performance: Les réseaux de neurones de graphes temporels (TGNNs) complexes fonctionnent moins bien que les méthodes heuristiques simples dans la tâche de prédiction d'affinité de nœuds
Limitations d'Expressivité: Les TGNNs existants ne peuvent pas représenter les opérations fondamentales telles que les moyennes mobiles
Inadéquation de la Fonction de Perte: La perte d'entropie croisée ne correspond pas à la nature de classement de la tâche d'affinité
Utilisation Insuffisante de l'Information: Les TGNNs n'exploitent pas pleinement les dynamiques temporelles globales et les dépendances à long terme

Motivation de la Recherche

Les auteurs découvrent par analyse théorique que les méthodes heuristiques simples sont en réalité des cas particuliers de modèles d'espace d'état linéaires (SSMs), fournissant une base théorique pour concevoir des architectures TGNN plus puissantes.

Contributions Principales

Contribution Théorique: Démonstration que les méthodes heuristiques simples sont des cas particuliers des SSMs linéaires, et conception d'une architecture TGNN capable de généraliser les méthodes heuristiques basée sur cette connexion
Innovation Architecturale: Proposition du modèle NAVIS, combinant un état global virtuel et des mécanismes d'espace d'état linéaires, résolvant efficacement le problème de prédiction d'affinité de nœuds
Amélioration de la Fonction de Perte: Analyse des insuffisances de la perte d'entropie croisée dans la prédiction d'affinité, proposition d'une perte Lambda basée sur le classement comme alternative
Validation Expérimentale: Vérification de l'efficacité de la méthode sur les benchmarks TGB et plusieurs ensembles de données, surpassant systématiquement les méthodes existantes et les baselines heuristiques

Explication Détaillée de la Méthode

Définition de la Tâche

Étant donné un graphe dynamique en temps continu (CTDG): $G_t = \{(u_j, v_j, \tau_j, w_j)\}_{j=1}^{J(t)}$

Pour un nœud de requête $u \in V$ et un instant futur $t^+ > t$ , l'objectif est de prédire le vecteur de scores d'affinité: $s = F_\theta(u, G_t, t^+) \in \mathbb{R}^{|V|}$

Fondements Théoriques

Théorème 1 (Les SSMs linéaires généralisent les heuristiques fondamentales): Soit $H$ l'ensemble des heuristiques fondamentales (PF, SMA, EMA), et $F_{\text{lin-SSM}}$ l'ensemble des mappages réalisables par SSM linéaire, alors: $H \subsetneq F_{\text{lin-SSM}}$

Théorème 2 (Limitations d'expressivité des RNN/LSTM/GRU): Les unités RNN, LSTM ou GRU standard ne peuvent pas représenter l'heuristique de prédiction persistante (PF) la plus élémentaire, c'est-à-dire qu'il n'existe pas de paramètres pour tous les séquences d'entrée tels que $h_i = x_i$ .

Architecture du Modèle NAVIS

NAVIS utilise un mécanisme d'espace d'état linéaire pour maintenir l'état de chaque nœud $h \in \mathbb{R}^d$ et un état global virtuel $g \in \mathbb{R}^d$ :

zh = σ(Wxh*x + Whh*hi-1 + bh)
hi = zh ⊙ hi-1 + (1-zh) ⊙ x
zs = σ(Wxs*x + Whs*hi + Wgs*g + bs)  
s = zs ⊙ hi + (1-zs) ⊙ x

Où:

$x$ : vecteur d'affinité précédent
$h_{i-1}, h_i$ : état précédent et état mis à jour
$g$ : vecteur global virtuel
$s$ : vecteur d'affinité prédit
$z_h, z_s$ : mécanismes de gating adaptatif

Caractéristiques de Conception Clés

Mécanisme de Mise à Jour Linéaire: Conserve la similarité conceptuelle avec l'EMA, mais permet un ajustement adaptatif à l'exécution
État Global Virtuel: Capture les tendances globales en maintenant un tampon de vecteurs d'affinité récents
Compatibilité avec le Mécanisme t-Batch: Ne dépend pas des états cachés des voisins, supportant le traitement par lots efficace
Scalabilité: S'adapte aux graphes à grande échelle par sparsification du pipeline de prédiction d'affinité

Conception de la Fonction de Perte

Analyse du Problème: Théorème 3 (Sous-optimalité de l'entropie croisée pour le classement): Il existe une infinité de triplets $(y, s_1, s_2)$ où $\text{rank}(s_1) = \text{rank}(y)$ et $\text{rank}(s_2) \neq \text{rank}(y)$ , mais $\ell_{CE}(s_1, y) > \ell_{CE}(s_2, y)$ .

Solution: Adoption de la perte Lambda: $\ell_{\text{Lambda}}(s,y) = \sum_{y_i > y_j} \log_2\left(\frac{1}{1 + e^{-\sigma(s_{\pi_i} - s_{\pi_j})}}\right) \delta_{ij} |A_{\pi_i} - A_{\pi_j}|$

Combinée avec une régularisation de marge par paires: $\ell_{\text{Reg}}(s,y) = \sum_{y_i > y_j} \max(0, -(s_{\pi_i} - s_{\pi_j}) + \Delta)$

Configuration Expérimentale

Ensembles de Données

Ensembles de Données TGB:

tgbn-trade: Réseau de commerce agricole entre pays de l'ONU 1986-2016 (255 nœuds, 468 245 arêtes)
tgbn-genre: Réseau d'interactions utilisateur-genre musical (1 505 nœuds, 17 858 395 arêtes)
tgbn-reddit: Réseau d'interactions utilisateur-subreddit (11 766 nœuds, 27 174 118 arêtes)
tgbn-token: Réseau d'interactions portefeuille-jeton de cryptomonnaie (61 756 nœuds, 72 936 998 arêtes)

Ensembles de Données de Prédiction de Liens Convertis:

Wikipedia: Réseau d'interactions éditeur-article
Flights: Réseau de routes aériennes pendant la COVID-19
USLegis: Réseau de collaboration du Sénat américain
UNVote: Réseau de votes de l'Assemblée générale des Nations unies

Métriques d'Évaluation

Métrique Principale: NDCG@10 (Normalized Discounted Cumulative Gain)
Configuration Expérimentale: Division temporelle 70%-15%-15%, 50 epochs, taille de lot 200

Méthodes de Comparaison

Méthodes Heuristiques: Persistent Forecast, Moving Average, Historical Average
Méthodes TGNN: JODIE, TGAT, CAWN, TCL, GraphMixer, DyGFormer, DyRep, TGN, TGNv2

Résultats Expérimentaux

Résultats Principaux

Performance sur les Ensembles de Données TGB (NDCG@10):

tgbn-trade: NAVIS 0,863 vs meilleure baseline TGNv2 0,735 (+17,4%)
tgbn-genre: NAVIS 0,520 vs meilleure baseline TGNv2 0,469 (+10,9%)
tgbn-reddit: NAVIS 0,552 vs meilleure baseline TGNv2 0,507 (+8,9%)
tgbn-token: NAVIS 0,444 vs meilleure baseline TGNv2 0,294 (+51,0%)

Performance sur les Ensembles de Données Convertis:

Wikipedia: NAVIS 0,573 vs TGNv2 0,433 (+32,3%)
Flights: NAVIS 0,499 vs TGNv2 0,299 (+66,9%)
USLegis: NAVIS 0,347 vs TGNv2 0,253 (+37,2%)
UNVote: NAVIS 0,952 vs TGNv2 0,813 (+17,1%)

Études d'Ablation

Les études d'ablation valident l'importance de chaque composant:

Mise à Jour d'État Linéaire vs GRU: 0,863 vs 0,850 sur tgbn-trade
Inclusion du Vecteur Global: Amélioration d'environ 1-2 points de pourcentage
Perte de Classement vs Entropie Croisée: Amélioration significative de la performance

Découvertes Clés

Confirmation de l'Avantage Heuristique: Les méthodes heuristiques simples surpassent effectivement les TGNNs complexes
Importance de l'Information Globale: L'état global virtuel capture efficacement les tendances au niveau du réseau
Correspondance de la Fonction de Perte: La perte consciente du classement est cruciale pour la prédiction d'affinité
Amélioration Cohérente: NAVIS a obtenu des améliorations cohérentes sur tous les ensembles de données

Travaux Connexes

Capacité d'Expression des Graphes Temporels

La recherche traditionnelle se concentre sur la capacité d'expression structurelle mesurée par le test WL, tandis que cet article se concentre sur la capacité d'expression fonctionnelle, c'est-à-dire la capacité à représenter des opérations mathématiques spécifiques.

Méthodes Heuristiques et Modèles d'Espace d'État

Les recherches récentes ont découvert que les méthodes heuristiques simples surpassent les TGNNs complexes sur plusieurs benchmarks. Cet article exploite pour la première fois explicitement l'équivalence formelle entre les heuristiques et les SSMs pour concevoir une architecture.

Réseaux de Neurones de Graphes Temporels

Les méthodes existantes incluent les architectures basées sur la mémoire (TGN, DyRep) et sans mémoire (DyGFormer, GraphMixer), mais aucune ne peut traiter efficacement les besoins spécifiques de la prédiction d'affinité de nœuds.

Conclusions et Discussion

Conclusions Principales

Les insuffisances des TGNNs existants dans la prédiction d'affinité de nœuds proviennent des limitations d'expressivité et de l'inadéquation des objectifs d'entraînement
Les modèles d'espace d'état linéaires fournissent un cadre théorique pour généraliser les méthodes heuristiques
NAVIS résout efficacement le problème de prédiction d'affinité de nœuds en combinant un état global virtuel et une perte consciente du classement

Limitations

Modélisation de Dépendances Complexes: Difficultés persistantes à modéliser les relations multi-sauts complexes
Scalabilité: La taille des paramètres croît linéairement avec le nombre de nœuds, nécessitant des stratégies de sparsification
Complétude Théorique: Résolution incomplète de tous les problèmes connexes

Directions Futures

Extension à la modélisation de dépendances temporelles plus complexes
Amélioration de la scalabilité pour les graphes à grande échelle
Exploration des possibilités des modèles d'espace d'état non linéaires

Évaluation Approfondie

Points Forts

Contributions Théoriques Solides: Établissement rigoureux par preuves mathématiques du lien entre les méthodes heuristiques et les SSMs
Analyse Approfondie du Problème: Analyse systématique des insuffisances des TGNNs dans la prédiction d'affinité de nœuds
Conception Méthodologique Rationnelle: La conception de NAVIS repose sur des fondements théoriques clairs et des considérations pratiques
Expériences Exhaustives: Expériences extensives sur plusieurs ensembles de données validant l'efficacité de la méthode
Rédaction Claire: Structure d'article claire avec description précise des détails techniques

Insuffisances

Degré d'Innovation Limité: Principalement l'application de théories existantes (SSMs) à un nouveau domaine problématique
Configuration Expérimentale: Certains ensembles de données sont relativement petits, expériences à grande échelle limitées
Équité de la Comparaison: Les comparaisons avec les méthodes de base peuvent présenter des différences d'implémentation
Capacité de Généralisation: Nécessite une validation sur davantage de types de graphes différents

Impact

Valeur Académique: Fournit une nouvelle perspective théorique pour l'apprentissage sur les graphes temporels
Valeur Pratique: Valeur directe dans les applications pratiques telles que les systèmes de recommandation
Reproductibilité: Implémentation de code complète fournie
Caractère Inspirant: Fournit des idées précieuses pour les recherches ultérieures

Scénarios d'Application

Systèmes de Recommandation: Prédiction d'affinité utilisateur-article
Réseaux Sociaux: Prédiction d'intensité d'interaction utilisateur
Réseaux Financiers: Prédiction d'intensité de relations commerciales
Réseaux de Chaîne d'Approvisionnement: Prédiction de relations de collaboration

Évaluation Globale: Cet article est une recherche de haute qualité qui, par une analyse théorique approfondie, révèle les insuffisances des méthodes existantes et propose des solutions efficaces. Le modèle NAVIS est bien conçu, les résultats expérimentaux sont convaincants, et il apporte une contribution positive au domaine de l'apprentissage sur les graphes temporels. La valeur principale de l'article réside dans la fourniture d'une nouvelle perspective théorique et d'un cadre méthodologique pratique.