Revisiting Node Affinity Prediction in Temporal Graphs
Mantri, Feldman, Eliasof et al.
Node affinity prediction is a common task that is widely used in temporal graph learning with applications in social and financial networks, recommender systems, and more. Recent works have addressed this task by adapting state-of-the-art dynamic link property prediction models to node affinity prediction. However, simple heuristics, such as Persistent Forecast or Moving Average, outperform these models. In this work, we analyze the challenges in training current Temporal Graph Neural Networks for node affinity prediction and suggest appropriate solutions. Combining the solutions, we develop NAViS - Node Affinity prediction model using Virtual State, by exploiting the equivalence between heuristics and state space models. While promising, training NAViS is non-trivial. Therefore, we further introduce a novel loss function for node affinity prediction. We evaluate NAViS on TGB and show that it outperforms the state-of-the-art, including heuristics. Our source code is available at https://github.com/orfeld415/NAVIS
academic
Überprüfung der Knotenverwandtschaftsprognose in zeitlichen Graphen
Die Knotenverwandtschaftsprognose ist eine wichtige Aufgabe beim Lernen zeitlicher Graphen mit breiter Anwendung in sozialen Netzwerken, Finanznetzen und Empfehlungssystemen. Obwohl neuere Forschungen die Aufgabe der Knotenverwandtschaftsprognose durch Anpassung modernster dynamischer Linkvorhersagemodelle angegangen ist, übertreffen einfache heuristische Methoden (wie persistente Vorhersage und gleitender Durchschnitt) diese komplexen Modelle. Dieser Artikel analysiert die Trainingsherausforderungen aktueller zeitlicher Graphenneuronaler Netze bei der Knotenverwandtschaftsprognose und schlägt entsprechende Lösungen vor. Durch die Kombination dieser Lösungen entwickelten die Autoren NAVIS (Node Affinity prediction model using Virtual State), das die Knotenverwandtschaftsprognose durch Nutzung der Äquivalenz zwischen heuristischen Methoden und Zustandsraummodellen realisiert.
Die Knotenverwandtschaftsprognose zielt darauf ab, die zukünftige Interaktionsstärke eines Knotens mit allen anderen Knoten vorherzusagen. Dies unterscheidet sich von der traditionellen Linkvorhersageaufgabe. Die Linkvorhersage konzentriert sich darauf, ob eine bestimmte Kante auftritt, während die Verwandtschaftsprognose eine vollständige Rangfolge aller potenziellen Nachbarn erfordert, was die Aufgabe anspruchsvoller, aber auch näher an praktischen Anforderungen macht.
Leistungsparadoxon: Komplexe zeitliche Graphenneuronale Netze (TGNNs) schneiden bei der Knotenverwandtschaftsprognose schlechter ab als einfache heuristische Methoden
Ausdrucksfähigkeitsbeschränkungen: Vorhandene TGNNs können grundlegende Operationen wie gleitende Durchschnitte nicht darstellen
Verlustfunktions-Nichtübereinstimmung: Kreuzentropie-Verlust stimmt nicht mit der Rangfolgenatur der Verwandtschaftsaufgabe überein
Unzureichende Informationsnutzung: TGNNs nutzen globale zeitliche Dynamiken und langfristige Abhängigkeitsinformationen nicht vollständig
Durch theoretische Analyse entdeckten die Autoren, dass einfache heuristische Methoden tatsächlich Spezialfälle linearer Zustandsraummodelle (SSMs) sind, was eine theoretische Grundlage für die Gestaltung stärkerer TGNN-Architekturen bietet.
Theoretischer Beitrag: Nachweis, dass einfache heuristische Methoden Spezialfälle linearer SSMs sind, und Gestaltung einer TGNN-Architektur basierend auf dieser Verbindung, die heuristische Methoden verallgemeinert
Architektur-Innovation: Vorschlag des NAVIS-Modells, das virtuelle globale Zustände und lineare Zustandsraummechanismen kombiniert, um das Knotenverwandtschaftsprognose-Problem effektiv zu lösen
Verbesserung der Verlustfunktion: Analyse der Unzulänglichkeiten der Kreuzentropie-Verlustfunktion bei der Verwandtschaftsprognose und Vorschlag einer rangfolgengestützten Lambda-Verlust-Alternative
Experimentelle Validierung: Validierung der Methode auf TGB-Benchmarks und mehreren Datensätzen, konsistent überlegen gegenüber bestehenden Methoden und heuristischen Baselines
Gegeben ein kontinuierlich-zeitlicher dynamischer Graph (CTDG):
Gt={(uj,vj,τj,wj)}j=1J(t)
Für einen Abfrageknoten u∈V und einen zukünftigen Zeitpunkt t+>t besteht das Ziel darin, den Verwandtschafts-Scorvektor vorherzusagen:
s=Fθ(u,Gt,t+)∈R∣V∣
Satz 1 (Lineare SSMs verallgemeinern grundlegende Heuristiken):
Sei H die Menge grundlegender Heuristiken (PF, SMA, EMA) und Flin-SSM die Menge der durch lineare SSMs realisierbaren Abbildungen, dann:
H⊊Flin-SSM
Satz 2 (Ausdrucksbeschränkungen von RNN/LSTM/GRU):
Standard-RNN-, LSTM- oder GRU-Einheiten können die grundlegendste persistente Vorhersage (PF)-Heuristik nicht darstellen, d.h. für alle Eingabesequenzen existieren keine Parameter, so dass hi=xi.
NAVIS verwendet einen linearen Zustandsraummechanismus zur Aufrechterhaltung des Zustands jedes Knotens h∈Rd und eines virtuellen globalen Zustands g∈Rd:
zh = σ(Wxh*x + Whh*hi-1 + bh)
hi = zh ⊙ hi-1 + (1-zh) ⊙ x
zs = σ(Wxs*x + Whs*hi + Wgs*g + bs)
s = zs ⊙ hi + (1-zs) ⊙ x
Problemanalyse:
Satz 3 (Suboptimalität der Kreuzentropie für Rangfolgen): Es existieren unendlich viele Tripel (y,s1,s2), bei denen rank(s1)=rank(y) und rank(s2)=rank(y), aber ℓCE(s1,y)>ℓCE(s2,y).
Lösung: Verwendung von Lambda-Verlust:
ℓLambda(s,y)=∑yi>yjlog2(1+e−σ(sπi−sπj)1)δij∣Aπi−Aπj∣
kombiniert mit paarweiser Margin-Regularisierung:
ℓReg(s,y)=∑yi>yjmax(0,−(sπi−sπj)+Δ)
Traditionelle Forschung konzentriert sich auf strukturelle Ausdrucksfähigkeit, gemessen durch WL-Tests. Dieser Artikel konzentriert sich auf funktionale Ausdrucksfähigkeit, d.h. die Fähigkeit, spezifische mathematische Operationen darzustellen.
Neuere Forschungen zeigen, dass einfache heuristische Methoden auf mehreren Benchmarks komplexe TGNNs übertreffen. Dieser Artikel nutzt erstmals explizit die formale Äquivalenz zwischen Heuristiken und SSMs zur Architekturgestaltung.
Vorhandene Methoden umfassen speicherbasierte (TGN, DyRep) und nicht-speicherbasierte (DyGFormer, GraphMixer) Architekturen, können aber die besonderen Anforderungen der Knotenverwandtschaftsprognose nicht effektiv erfüllen.
Die Unzulänglichkeiten bestehender TGNNs bei der Knotenverwandtschaftsprognose stammen aus Ausdrucksfähigkeitsbeschränkungen und Trainingszielen, die nicht übereinstimmen
Lineare Zustandsraummodelle bieten einen theoretischen Rahmen zur Verallgemeinerung heuristischer Methoden
NAVIS löst das Knotenverwandtschaftsprognose-Problem effektiv durch Kombination virtueller globaler Zustände und rangfolgen-bewusster Verluste
Empfehlungssysteme: Vorhersage der Benutzer-Objekt-Verwandtschaft
Soziale Netzwerke: Vorhersage der Benutzerinteraktionsstärke
Finanznetze: Vorhersage der Handelsbeziehungsstärke
Lieferkettennetze: Vorhersage von Kooperationsbeziehungen
Gesamtbewertung: Dies ist ein hochqualitatives Forschungspapier, das durch tiefgreifende theoretische Analyse die Unzulänglichkeiten bestehender Methoden offenbart und effektive Lösungen vorschlägt. Das NAVIS-Modell ist vernünftig gestaltet, die Experimentenergebnisse sind überzeugend und trägt positiv zum Bereich des zeitlichen Graphenlernens bei. Der Hauptwert des Papiers liegt in der Bereitstellung neuer theoretischer Perspektiven und eines praktischen Methoden-Frameworks.