2025-11-14T22:58:11.335175

Revisiting Node Affinity Prediction in Temporal Graphs

Mantri, Feldman, Eliasof et al.
Node affinity prediction is a common task that is widely used in temporal graph learning with applications in social and financial networks, recommender systems, and more. Recent works have addressed this task by adapting state-of-the-art dynamic link property prediction models to node affinity prediction. However, simple heuristics, such as Persistent Forecast or Moving Average, outperform these models. In this work, we analyze the challenges in training current Temporal Graph Neural Networks for node affinity prediction and suggest appropriate solutions. Combining the solutions, we develop NAViS - Node Affinity prediction model using Virtual State, by exploiting the equivalence between heuristics and state space models. While promising, training NAViS is non-trivial. Therefore, we further introduce a novel loss function for node affinity prediction. We evaluate NAViS on TGB and show that it outperforms the state-of-the-art, including heuristics. Our source code is available at https://github.com/orfeld415/NAVIS
academic

Überprüfung der Knotenverwandtschaftsprognose in zeitlichen Graphen

Grundinformationen

  • Paper-ID: 2510.06940
  • Titel: Revisiting Node Affinity Prediction in Temporal Graphs
  • Autoren: Krishna Sri Ipsit Mantri, Or Feldman, Moshe Eliasof, Chaim Baskin
  • Klassifizierung: cs.LG (Machine Learning)
  • Veröffentlichungsstatus: Preprint. Zur Überprüfung eingereicht
  • Paper-Link: https://arxiv.org/abs/2510.06940
  • Code-Link: https://github.com/orfeld415/NAVIS

Zusammenfassung

Die Knotenverwandtschaftsprognose ist eine wichtige Aufgabe beim Lernen zeitlicher Graphen mit breiter Anwendung in sozialen Netzwerken, Finanznetzen und Empfehlungssystemen. Obwohl neuere Forschungen die Aufgabe der Knotenverwandtschaftsprognose durch Anpassung modernster dynamischer Linkvorhersagemodelle angegangen ist, übertreffen einfache heuristische Methoden (wie persistente Vorhersage und gleitender Durchschnitt) diese komplexen Modelle. Dieser Artikel analysiert die Trainingsherausforderungen aktueller zeitlicher Graphenneuronaler Netze bei der Knotenverwandtschaftsprognose und schlägt entsprechende Lösungen vor. Durch die Kombination dieser Lösungen entwickelten die Autoren NAVIS (Node Affinity prediction model using Virtual State), das die Knotenverwandtschaftsprognose durch Nutzung der Äquivalenz zwischen heuristischen Methoden und Zustandsraummodellen realisiert.

Forschungshintergrund und Motivation

Problemdefinition

Die Knotenverwandtschaftsprognose zielt darauf ab, die zukünftige Interaktionsstärke eines Knotens mit allen anderen Knoten vorherzusagen. Dies unterscheidet sich von der traditionellen Linkvorhersageaufgabe. Die Linkvorhersage konzentriert sich darauf, ob eine bestimmte Kante auftritt, während die Verwandtschaftsprognose eine vollständige Rangfolge aller potenziellen Nachbarn erfordert, was die Aufgabe anspruchsvoller, aber auch näher an praktischen Anforderungen macht.

Kernprobleme

  1. Leistungsparadoxon: Komplexe zeitliche Graphenneuronale Netze (TGNNs) schneiden bei der Knotenverwandtschaftsprognose schlechter ab als einfache heuristische Methoden
  2. Ausdrucksfähigkeitsbeschränkungen: Vorhandene TGNNs können grundlegende Operationen wie gleitende Durchschnitte nicht darstellen
  3. Verlustfunktions-Nichtübereinstimmung: Kreuzentropie-Verlust stimmt nicht mit der Rangfolgenatur der Verwandtschaftsaufgabe überein
  4. Unzureichende Informationsnutzung: TGNNs nutzen globale zeitliche Dynamiken und langfristige Abhängigkeitsinformationen nicht vollständig

Forschungsmotivation

Durch theoretische Analyse entdeckten die Autoren, dass einfache heuristische Methoden tatsächlich Spezialfälle linearer Zustandsraummodelle (SSMs) sind, was eine theoretische Grundlage für die Gestaltung stärkerer TGNN-Architekturen bietet.

Kernbeiträge

  1. Theoretischer Beitrag: Nachweis, dass einfache heuristische Methoden Spezialfälle linearer SSMs sind, und Gestaltung einer TGNN-Architektur basierend auf dieser Verbindung, die heuristische Methoden verallgemeinert
  2. Architektur-Innovation: Vorschlag des NAVIS-Modells, das virtuelle globale Zustände und lineare Zustandsraummechanismen kombiniert, um das Knotenverwandtschaftsprognose-Problem effektiv zu lösen
  3. Verbesserung der Verlustfunktion: Analyse der Unzulänglichkeiten der Kreuzentropie-Verlustfunktion bei der Verwandtschaftsprognose und Vorschlag einer rangfolgengestützten Lambda-Verlust-Alternative
  4. Experimentelle Validierung: Validierung der Methode auf TGB-Benchmarks und mehreren Datensätzen, konsistent überlegen gegenüber bestehenden Methoden und heuristischen Baselines

Methodische Erläuterung

Aufgabendefinition

Gegeben ein kontinuierlich-zeitlicher dynamischer Graph (CTDG): Gt={(uj,vj,τj,wj)}j=1J(t)G_t = \{(u_j, v_j, \tau_j, w_j)\}_{j=1}^{J(t)}

Für einen Abfrageknoten uVu \in V und einen zukünftigen Zeitpunkt t+>tt^+ > t besteht das Ziel darin, den Verwandtschafts-Scorvektor vorherzusagen: s=Fθ(u,Gt,t+)RVs = F_\theta(u, G_t, t^+) \in \mathbb{R}^{|V|}

Theoretische Grundlagen

Satz 1 (Lineare SSMs verallgemeinern grundlegende Heuristiken): Sei HH die Menge grundlegender Heuristiken (PF, SMA, EMA) und Flin-SSMF_{\text{lin-SSM}} die Menge der durch lineare SSMs realisierbaren Abbildungen, dann: HFlin-SSMH \subsetneq F_{\text{lin-SSM}}

Satz 2 (Ausdrucksbeschränkungen von RNN/LSTM/GRU): Standard-RNN-, LSTM- oder GRU-Einheiten können die grundlegendste persistente Vorhersage (PF)-Heuristik nicht darstellen, d.h. für alle Eingabesequenzen existieren keine Parameter, so dass hi=xih_i = x_i.

NAVIS verwendet einen linearen Zustandsraummechanismus zur Aufrechterhaltung des Zustands jedes Knotens hRdh \in \mathbb{R}^d und eines virtuellen globalen Zustands gRdg \in \mathbb{R}^d:

zh = σ(Wxh*x + Whh*hi-1 + bh)
hi = zh ⊙ hi-1 + (1-zh) ⊙ x
zs = σ(Wxs*x + Whs*hi + Wgs*g + bs)  
s = zs ⊙ hi + (1-zs) ⊙ x

Wobei:

  • xx: vorheriger Verwandtschaftsvektor
  • hi1,hih_{i-1}, h_i: vorheriger und aktualisierter Zustand
  • gg: virtueller globaler Vektor
  • ss: vorhergesagter Verwandtschaftsvektor
  • zh,zsz_h, z_s: adaptive Gating-Mechanismen

Wichtige Designmerkmale

  1. Linearer Aktualisierungsmechanismus: Behält konzeptionelle Ähnlichkeit mit EMA bei, ermöglicht aber adaptive Anpassung zur Laufzeit
  2. Virtueller globaler Zustand: Erfasst globale Trends durch Aufrechterhaltung eines Puffers der letzten Verwandtschaftsvektoren
  3. Kompatibilität mit t-Batch-Mechanismus: Hängt nicht von Nachbar-Verdeckungszuständen ab, unterstützt effiziente Batch-Verarbeitung
  4. Skalierbarkeit: Passt sich großen Graphen durch Sparsifizierung der Verwandtschaftsprognose-Pipeline an

Verlustfunktionsgestaltung

Problemanalyse: Satz 3 (Suboptimalität der Kreuzentropie für Rangfolgen): Es existieren unendlich viele Tripel (y,s1,s2)(y, s_1, s_2), bei denen rank(s1)=rank(y)\text{rank}(s_1) = \text{rank}(y) und rank(s2)rank(y)\text{rank}(s_2) \neq \text{rank}(y), aber CE(s1,y)>CE(s2,y)\ell_{CE}(s_1, y) > \ell_{CE}(s_2, y).

Lösung: Verwendung von Lambda-Verlust: Lambda(s,y)=yi>yjlog2(11+eσ(sπisπj))δijAπiAπj\ell_{\text{Lambda}}(s,y) = \sum_{y_i > y_j} \log_2\left(\frac{1}{1 + e^{-\sigma(s_{\pi_i} - s_{\pi_j})}}\right) \delta_{ij} |A_{\pi_i} - A_{\pi_j}|

kombiniert mit paarweiser Margin-Regularisierung: Reg(s,y)=yi>yjmax(0,(sπisπj)+Δ)\ell_{\text{Reg}}(s,y) = \sum_{y_i > y_j} \max(0, -(s_{\pi_i} - s_{\pi_j}) + \Delta)

Experimentelle Einrichtung

Datensätze

TGB-Datensätze:

  • tgbn-trade: UN-Handelsnetzwerk zwischen Ländern 1986-2016 (255 Knoten, 468.245 Kanten)
  • tgbn-genre: Benutzer-Musikgenre-Interaktionsnetzwerk (1.505 Knoten, 17.858.395 Kanten)
  • tgbn-reddit: Benutzer-Subreddit-Interaktionsnetzwerk (11.766 Knoten, 27.174.118 Kanten)
  • tgbn-token: Wallet-Kryptowährungs-Token-Interaktionsnetzwerk (61.756 Knoten, 72.936.998 Kanten)

Konvertierte Linkvorhersage-Datensätze:

  • Wikipedia: Redakteur-Artikel-Interaktionsnetzwerk
  • Flights: Flughafenrouten-Netzwerk während COVID-19
  • USLegis: US-Senat-Kooperationsnetzwerk
  • UNVote: Abstimmungsnetzwerk der Generalversammlung der Vereinten Nationen

Bewertungsmetriken

  • Primäre Metrik: NDCG@10 (Normalized Discounted Cumulative Gain)
  • Experimentelle Einrichtung: 70%-15%-15% zeitliche Aufteilung, 50 Epochen, Batch-Größe 200

Vergleichsmethoden

  • Heuristische Methoden: Persistent Forecast, Moving Average, Historical Average
  • TGNN-Methoden: JODIE, TGAT, CAWN, TCL, GraphMixer, DyGFormer, DyRep, TGN, TGNv2

Experimentelle Ergebnisse

Hauptergebnisse

TGB-Datensatz-Leistung (NDCG@10):

  • tgbn-trade: NAVIS 0,863 vs beste Baseline TGNv2 0,735 (+17,4%)
  • tgbn-genre: NAVIS 0,520 vs beste Baseline TGNv2 0,469 (+10,9%)
  • tgbn-reddit: NAVIS 0,552 vs beste Baseline TGNv2 0,507 (+8,9%)
  • tgbn-token: NAVIS 0,444 vs beste Baseline TGNv2 0,294 (+51,0%)

Leistung konvertierter Datensätze:

  • Wikipedia: NAVIS 0,573 vs TGNv2 0,433 (+32,3%)
  • Flights: NAVIS 0,499 vs TGNv2 0,299 (+66,9%)
  • USLegis: NAVIS 0,347 vs TGNv2 0,253 (+37,2%)
  • UNVote: NAVIS 0,952 vs TGNv2 0,813 (+17,1%)

Ablationsstudien

Ablationsstudien validieren die Wichtigkeit jeder Komponente:

  • Lineare Zustandsaktualisierung vs GRU: 0,863 vs 0,850 auf tgbn-trade
  • Einbeziehung des globalen Vektors: Verbesserung um etwa 1-2 Prozentpunkte
  • Rangfolge-Verlust vs Kreuzentropie: Signifikante Leistungsverbesserung

Wichtige Erkenntnisse

  1. Bestätigung des heuristischen Vorteils: Einfache heuristische Methoden sind tatsächlich komplexen TGNNs überlegen
  2. Wichtigkeit globaler Informationen: Der virtuelle globale Zustand erfasst effektiv Netzwerk-Level-Trends
  3. Verlustfunktions-Matching: Rangfolgen-bewusste Verluste sind für die Verwandtschaftsprognose entscheidend
  4. Konsistente Verbesserung: NAVIS erreicht konsistente Verbesserungen auf allen Datensätzen

Verwandte Arbeiten

Ausdrucksfähigkeit zeitlicher Graphen

Traditionelle Forschung konzentriert sich auf strukturelle Ausdrucksfähigkeit, gemessen durch WL-Tests. Dieser Artikel konzentriert sich auf funktionale Ausdrucksfähigkeit, d.h. die Fähigkeit, spezifische mathematische Operationen darzustellen.

Heuristische Methoden und Zustandsraummodelle

Neuere Forschungen zeigen, dass einfache heuristische Methoden auf mehreren Benchmarks komplexe TGNNs übertreffen. Dieser Artikel nutzt erstmals explizit die formale Äquivalenz zwischen Heuristiken und SSMs zur Architekturgestaltung.

Zeitliche Graphenneuronale Netze

Vorhandene Methoden umfassen speicherbasierte (TGN, DyRep) und nicht-speicherbasierte (DyGFormer, GraphMixer) Architekturen, können aber die besonderen Anforderungen der Knotenverwandtschaftsprognose nicht effektiv erfüllen.

Schlussfolgerungen und Diskussion

Hauptschlussfolgerungen

  1. Die Unzulänglichkeiten bestehender TGNNs bei der Knotenverwandtschaftsprognose stammen aus Ausdrucksfähigkeitsbeschränkungen und Trainingszielen, die nicht übereinstimmen
  2. Lineare Zustandsraummodelle bieten einen theoretischen Rahmen zur Verallgemeinerung heuristischer Methoden
  3. NAVIS löst das Knotenverwandtschaftsprognose-Problem effektiv durch Kombination virtueller globaler Zustände und rangfolgen-bewusster Verluste

Einschränkungen

  1. Modellierung komplexer Abhängigkeiten: Schwierigkeiten bei der Modellierung komplexer Multi-Hop-Abhängigkeiten
  2. Skalierbarkeit: Parametergröße wächst linear mit der Knotenzahl, erfordert Sparsifizierungsstrategien
  3. Theoretische Vollständigkeit: Nicht alle verwandten Probleme sind vollständig gelöst

Zukünftige Richtungen

  1. Erweiterung auf komplexere zeitliche Abhängigkeitsmodellierung
  2. Verbesserung der Skalierbarkeit für große Graphen
  3. Erkundung der Möglichkeiten nichtlinearer Zustandsraummodelle

Tiefgreifende Bewertung

Stärken

  1. Solide theoretische Beiträge: Strenge mathematische Beweise etablieren die Verbindung zwischen heuristischen Methoden und SSMs
  2. Tiefgreifende Problemanalyse: Systematische Analyse der Unzulänglichkeiten von TGNNs bei der Knotenverwandtschaftsprognose
  3. Vernünftige Methodengestaltung: NAVIS-Design hat klare theoretische Grundlagen und praktische Überlegungen
  4. Umfangreiche Experimente: Extensive Experimente auf mehreren Datensätzen validieren die Methodeneffektivität
  5. Klare Präsentation: Klare Papierstruktur, genaue technische Beschreibungen

Schwächen

  1. Begrenzte Innovationsstufe: Hauptsächlich Anwendung bestehender Theorie (SSMs) auf neue Problemdomäne
  2. Experimentelle Einrichtung: Einige Datensätze sind relativ klein, begrenzte großflächige Experimente
  3. Vergleichsfairness: Vergleiche mit Baseline-Methoden könnten Implementierungsunterschiede aufweisen
  4. Generalisierungsfähigkeit: Benötigt Validierung auf mehr verschiedenen Graphtypen

Einflussfähigkeit

  1. Akademischer Wert: Bietet neue theoretische Perspektive für zeitliches Graphenlernen
  2. Praktischer Wert: Direkter Wert in praktischen Anwendungen wie Empfehlungssystemen
  3. Reproduzierbarkeit: Vollständige Code-Implementierung bereitgestellt
  4. Inspirationswert: Bietet wertvolle Ideen für nachfolgende Forschung

Anwendungsszenarien

  1. Empfehlungssysteme: Vorhersage der Benutzer-Objekt-Verwandtschaft
  2. Soziale Netzwerke: Vorhersage der Benutzerinteraktionsstärke
  3. Finanznetze: Vorhersage der Handelsbeziehungsstärke
  4. Lieferkettennetze: Vorhersage von Kooperationsbeziehungen

Gesamtbewertung: Dies ist ein hochqualitatives Forschungspapier, das durch tiefgreifende theoretische Analyse die Unzulänglichkeiten bestehender Methoden offenbart und effektive Lösungen vorschlägt. Das NAVIS-Modell ist vernünftig gestaltet, die Experimentenergebnisse sind überzeugend und trägt positiv zum Bereich des zeitlichen Graphenlernens bei. Der Hauptwert des Papiers liegt in der Bereitstellung neuer theoretischer Perspektiven und eines praktischen Methoden-Frameworks.