2025-11-14T22:58:11.335175

Revisiting Node Affinity Prediction in Temporal Graphs

Mantri, Feldman, Eliasof et al.

Node affinity prediction is a common task that is widely used in temporal graph learning with applications in social and financial networks, recommender systems, and more. Recent works have addressed this task by adapting state-of-the-art dynamic link property prediction models to node affinity prediction. However, simple heuristics, such as Persistent Forecast or Moving Average, outperform these models. In this work, we analyze the challenges in training current Temporal Graph Neural Networks for node affinity prediction and suggest appropriate solutions. Combining the solutions, we develop NAViS - Node Affinity prediction model using Virtual State, by exploiting the equivalence between heuristics and state space models. While promising, training NAViS is non-trivial. Therefore, we further introduce a novel loss function for node affinity prediction. We evaluate NAViS on TGB and show that it outperforms the state-of-the-art, including heuristics. Our source code is available at https://github.com/orfeld415/NAVIS

academic

Überprüfung der Knotenverwandtschaftsprognose in zeitlichen Graphen

Grundinformationen

Paper-ID: 2510.06940
Titel: Revisiting Node Affinity Prediction in Temporal Graphs
Autoren: Krishna Sri Ipsit Mantri, Or Feldman, Moshe Eliasof, Chaim Baskin
Klassifizierung: cs.LG (Machine Learning)
Veröffentlichungsstatus: Preprint. Zur Überprüfung eingereicht
Paper-Link: https://arxiv.org/abs/2510.06940
Code-Link: https://github.com/orfeld415/NAVIS

Zusammenfassung

Die Knotenverwandtschaftsprognose ist eine wichtige Aufgabe beim Lernen zeitlicher Graphen mit breiter Anwendung in sozialen Netzwerken, Finanznetzen und Empfehlungssystemen. Obwohl neuere Forschungen die Aufgabe der Knotenverwandtschaftsprognose durch Anpassung modernster dynamischer Linkvorhersagemodelle angegangen ist, übertreffen einfache heuristische Methoden (wie persistente Vorhersage und gleitender Durchschnitt) diese komplexen Modelle. Dieser Artikel analysiert die Trainingsherausforderungen aktueller zeitlicher Graphenneuronaler Netze bei der Knotenverwandtschaftsprognose und schlägt entsprechende Lösungen vor. Durch die Kombination dieser Lösungen entwickelten die Autoren NAVIS (Node Affinity prediction model using Virtual State), das die Knotenverwandtschaftsprognose durch Nutzung der Äquivalenz zwischen heuristischen Methoden und Zustandsraummodellen realisiert.

Forschungshintergrund und Motivation

Problemdefinition

Die Knotenverwandtschaftsprognose zielt darauf ab, die zukünftige Interaktionsstärke eines Knotens mit allen anderen Knoten vorherzusagen. Dies unterscheidet sich von der traditionellen Linkvorhersageaufgabe. Die Linkvorhersage konzentriert sich darauf, ob eine bestimmte Kante auftritt, während die Verwandtschaftsprognose eine vollständige Rangfolge aller potenziellen Nachbarn erfordert, was die Aufgabe anspruchsvoller, aber auch näher an praktischen Anforderungen macht.

Kernprobleme

Leistungsparadoxon: Komplexe zeitliche Graphenneuronale Netze (TGNNs) schneiden bei der Knotenverwandtschaftsprognose schlechter ab als einfache heuristische Methoden
Ausdrucksfähigkeitsbeschränkungen: Vorhandene TGNNs können grundlegende Operationen wie gleitende Durchschnitte nicht darstellen
Verlustfunktions-Nichtübereinstimmung: Kreuzentropie-Verlust stimmt nicht mit der Rangfolgenatur der Verwandtschaftsaufgabe überein
Unzureichende Informationsnutzung: TGNNs nutzen globale zeitliche Dynamiken und langfristige Abhängigkeitsinformationen nicht vollständig

Forschungsmotivation

Durch theoretische Analyse entdeckten die Autoren, dass einfache heuristische Methoden tatsächlich Spezialfälle linearer Zustandsraummodelle (SSMs) sind, was eine theoretische Grundlage für die Gestaltung stärkerer TGNN-Architekturen bietet.

Kernbeiträge

Theoretischer Beitrag: Nachweis, dass einfache heuristische Methoden Spezialfälle linearer SSMs sind, und Gestaltung einer TGNN-Architektur basierend auf dieser Verbindung, die heuristische Methoden verallgemeinert
Architektur-Innovation: Vorschlag des NAVIS-Modells, das virtuelle globale Zustände und lineare Zustandsraummechanismen kombiniert, um das Knotenverwandtschaftsprognose-Problem effektiv zu lösen
Verbesserung der Verlustfunktion: Analyse der Unzulänglichkeiten der Kreuzentropie-Verlustfunktion bei der Verwandtschaftsprognose und Vorschlag einer rangfolgengestützten Lambda-Verlust-Alternative
Experimentelle Validierung: Validierung der Methode auf TGB-Benchmarks und mehreren Datensätzen, konsistent überlegen gegenüber bestehenden Methoden und heuristischen Baselines

Methodische Erläuterung

Aufgabendefinition

Gegeben ein kontinuierlich-zeitlicher dynamischer Graph (CTDG): $G_t = \{(u_j, v_j, \tau_j, w_j)\}_{j=1}^{J(t)}$

Für einen Abfrageknoten $u \in V$ und einen zukünftigen Zeitpunkt $t^+ > t$ besteht das Ziel darin, den Verwandtschafts-Scorvektor vorherzusagen: $s = F_\theta(u, G_t, t^+) \in \mathbb{R}^{|V|}$

Theoretische Grundlagen

Satz 1 (Lineare SSMs verallgemeinern grundlegende Heuristiken): Sei $H$ die Menge grundlegender Heuristiken (PF, SMA, EMA) und $F_{\text{lin-SSM}}$ die Menge der durch lineare SSMs realisierbaren Abbildungen, dann: $H \subsetneq F_{\text{lin-SSM}}$

Satz 2 (Ausdrucksbeschränkungen von RNN/LSTM/GRU): Standard-RNN-, LSTM- oder GRU-Einheiten können die grundlegendste persistente Vorhersage (PF)-Heuristik nicht darstellen, d.h. für alle Eingabesequenzen existieren keine Parameter, so dass $h_i = x_i$ .

NAVIS-Modellarchitektur

NAVIS verwendet einen linearen Zustandsraummechanismus zur Aufrechterhaltung des Zustands jedes Knotens $h \in \mathbb{R}^d$ und eines virtuellen globalen Zustands $g \in \mathbb{R}^d$ :

zh = σ(Wxh*x + Whh*hi-1 + bh)
hi = zh ⊙ hi-1 + (1-zh) ⊙ x
zs = σ(Wxs*x + Whs*hi + Wgs*g + bs)  
s = zs ⊙ hi + (1-zs) ⊙ x

Wobei:

$x$ : vorheriger Verwandtschaftsvektor
$h_{i-1}, h_i$ : vorheriger und aktualisierter Zustand
$g$ : virtueller globaler Vektor
$s$ : vorhergesagter Verwandtschaftsvektor
$z_h, z_s$ : adaptive Gating-Mechanismen

Wichtige Designmerkmale

Linearer Aktualisierungsmechanismus: Behält konzeptionelle Ähnlichkeit mit EMA bei, ermöglicht aber adaptive Anpassung zur Laufzeit
Virtueller globaler Zustand: Erfasst globale Trends durch Aufrechterhaltung eines Puffers der letzten Verwandtschaftsvektoren
Kompatibilität mit t-Batch-Mechanismus: Hängt nicht von Nachbar-Verdeckungszuständen ab, unterstützt effiziente Batch-Verarbeitung
Skalierbarkeit: Passt sich großen Graphen durch Sparsifizierung der Verwandtschaftsprognose-Pipeline an

Verlustfunktionsgestaltung

Problemanalyse: Satz 3 (Suboptimalität der Kreuzentropie für Rangfolgen): Es existieren unendlich viele Tripel $(y, s_1, s_2)$ , bei denen $\text{rank}(s_1) = \text{rank}(y)$ und $\text{rank}(s_2) \neq \text{rank}(y)$ , aber $\ell_{CE}(s_1, y) > \ell_{CE}(s_2, y)$ .

Lösung: Verwendung von Lambda-Verlust: $\ell_{\text{Lambda}}(s,y) = \sum_{y_i > y_j} \log_2\left(\frac{1}{1 + e^{-\sigma(s_{\pi_i} - s_{\pi_j})}}\right) \delta_{ij} |A_{\pi_i} - A_{\pi_j}|$

kombiniert mit paarweiser Margin-Regularisierung: $\ell_{\text{Reg}}(s,y) = \sum_{y_i > y_j} \max(0, -(s_{\pi_i} - s_{\pi_j}) + \Delta)$

Experimentelle Einrichtung

Datensätze

TGB-Datensätze:

tgbn-trade: UN-Handelsnetzwerk zwischen Ländern 1986-2016 (255 Knoten, 468.245 Kanten)
tgbn-genre: Benutzer-Musikgenre-Interaktionsnetzwerk (1.505 Knoten, 17.858.395 Kanten)
tgbn-reddit: Benutzer-Subreddit-Interaktionsnetzwerk (11.766 Knoten, 27.174.118 Kanten)
tgbn-token: Wallet-Kryptowährungs-Token-Interaktionsnetzwerk (61.756 Knoten, 72.936.998 Kanten)

Konvertierte Linkvorhersage-Datensätze:

Wikipedia: Redakteur-Artikel-Interaktionsnetzwerk
Flights: Flughafenrouten-Netzwerk während COVID-19
USLegis: US-Senat-Kooperationsnetzwerk
UNVote: Abstimmungsnetzwerk der Generalversammlung der Vereinten Nationen

Bewertungsmetriken

Primäre Metrik: NDCG@10 (Normalized Discounted Cumulative Gain)
Experimentelle Einrichtung: 70%-15%-15% zeitliche Aufteilung, 50 Epochen, Batch-Größe 200

Vergleichsmethoden

Heuristische Methoden: Persistent Forecast, Moving Average, Historical Average
TGNN-Methoden: JODIE, TGAT, CAWN, TCL, GraphMixer, DyGFormer, DyRep, TGN, TGNv2

Experimentelle Ergebnisse

Hauptergebnisse

TGB-Datensatz-Leistung (NDCG@10):

tgbn-trade: NAVIS 0,863 vs beste Baseline TGNv2 0,735 (+17,4%)
tgbn-genre: NAVIS 0,520 vs beste Baseline TGNv2 0,469 (+10,9%)
tgbn-reddit: NAVIS 0,552 vs beste Baseline TGNv2 0,507 (+8,9%)
tgbn-token: NAVIS 0,444 vs beste Baseline TGNv2 0,294 (+51,0%)

Leistung konvertierter Datensätze:

Wikipedia: NAVIS 0,573 vs TGNv2 0,433 (+32,3%)
Flights: NAVIS 0,499 vs TGNv2 0,299 (+66,9%)
USLegis: NAVIS 0,347 vs TGNv2 0,253 (+37,2%)
UNVote: NAVIS 0,952 vs TGNv2 0,813 (+17,1%)

Ablationsstudien

Ablationsstudien validieren die Wichtigkeit jeder Komponente:

Lineare Zustandsaktualisierung vs GRU: 0,863 vs 0,850 auf tgbn-trade
Einbeziehung des globalen Vektors: Verbesserung um etwa 1-2 Prozentpunkte
Rangfolge-Verlust vs Kreuzentropie: Signifikante Leistungsverbesserung

Wichtige Erkenntnisse

Bestätigung des heuristischen Vorteils: Einfache heuristische Methoden sind tatsächlich komplexen TGNNs überlegen
Wichtigkeit globaler Informationen: Der virtuelle globale Zustand erfasst effektiv Netzwerk-Level-Trends
Verlustfunktions-Matching: Rangfolgen-bewusste Verluste sind für die Verwandtschaftsprognose entscheidend
Konsistente Verbesserung: NAVIS erreicht konsistente Verbesserungen auf allen Datensätzen

Schlussfolgerungen und Diskussion

Hauptschlussfolgerungen

Die Unzulänglichkeiten bestehender TGNNs bei der Knotenverwandtschaftsprognose stammen aus Ausdrucksfähigkeitsbeschränkungen und Trainingszielen, die nicht übereinstimmen
Lineare Zustandsraummodelle bieten einen theoretischen Rahmen zur Verallgemeinerung heuristischer Methoden
NAVIS löst das Knotenverwandtschaftsprognose-Problem effektiv durch Kombination virtueller globaler Zustände und rangfolgen-bewusster Verluste

Einschränkungen

Modellierung komplexer Abhängigkeiten: Schwierigkeiten bei der Modellierung komplexer Multi-Hop-Abhängigkeiten
Skalierbarkeit: Parametergröße wächst linear mit der Knotenzahl, erfordert Sparsifizierungsstrategien
Theoretische Vollständigkeit: Nicht alle verwandten Probleme sind vollständig gelöst

Zukünftige Richtungen

Erweiterung auf komplexere zeitliche Abhängigkeitsmodellierung
Verbesserung der Skalierbarkeit für große Graphen
Erkundung der Möglichkeiten nichtlinearer Zustandsraummodelle

Tiefgreifende Bewertung

Stärken

Solide theoretische Beiträge: Strenge mathematische Beweise etablieren die Verbindung zwischen heuristischen Methoden und SSMs
Tiefgreifende Problemanalyse: Systematische Analyse der Unzulänglichkeiten von TGNNs bei der Knotenverwandtschaftsprognose
Vernünftige Methodengestaltung: NAVIS-Design hat klare theoretische Grundlagen und praktische Überlegungen
Umfangreiche Experimente: Extensive Experimente auf mehreren Datensätzen validieren die Methodeneffektivität
Klare Präsentation: Klare Papierstruktur, genaue technische Beschreibungen

Schwächen

Begrenzte Innovationsstufe: Hauptsächlich Anwendung bestehender Theorie (SSMs) auf neue Problemdomäne
Experimentelle Einrichtung: Einige Datensätze sind relativ klein, begrenzte großflächige Experimente
Vergleichsfairness: Vergleiche mit Baseline-Methoden könnten Implementierungsunterschiede aufweisen
Generalisierungsfähigkeit: Benötigt Validierung auf mehr verschiedenen Graphtypen

Einflussfähigkeit

Akademischer Wert: Bietet neue theoretische Perspektive für zeitliches Graphenlernen
Praktischer Wert: Direkter Wert in praktischen Anwendungen wie Empfehlungssystemen
Reproduzierbarkeit: Vollständige Code-Implementierung bereitgestellt
Inspirationswert: Bietet wertvolle Ideen für nachfolgende Forschung

Anwendungsszenarien

Empfehlungssysteme: Vorhersage der Benutzer-Objekt-Verwandtschaft
Soziale Netzwerke: Vorhersage der Benutzerinteraktionsstärke
Finanznetze: Vorhersage der Handelsbeziehungsstärke
Lieferkettennetze: Vorhersage von Kooperationsbeziehungen

Gesamtbewertung: Dies ist ein hochqualitatives Forschungspapier, das durch tiefgreifende theoretische Analyse die Unzulänglichkeiten bestehender Methoden offenbart und effektive Lösungen vorschlägt. Das NAVIS-Modell ist vernünftig gestaltet, die Experimentenergebnisse sind überzeugend und trägt positiv zum Bereich des zeitlichen Graphenlernens bei. Der Hauptwert des Papiers liegt in der Bereitstellung neuer theoretischer Perspektiven und eines praktischen Methoden-Frameworks.