2025-11-14T22:58:11.335175

Revisiting Node Affinity Prediction in Temporal Graphs

Mantri, Feldman, Eliasof et al.
Node affinity prediction is a common task that is widely used in temporal graph learning with applications in social and financial networks, recommender systems, and more. Recent works have addressed this task by adapting state-of-the-art dynamic link property prediction models to node affinity prediction. However, simple heuristics, such as Persistent Forecast or Moving Average, outperform these models. In this work, we analyze the challenges in training current Temporal Graph Neural Networks for node affinity prediction and suggest appropriate solutions. Combining the solutions, we develop NAViS - Node Affinity prediction model using Virtual State, by exploiting the equivalence between heuristics and state space models. While promising, training NAViS is non-trivial. Therefore, we further introduce a novel loss function for node affinity prediction. We evaluate NAViS on TGB and show that it outperforms the state-of-the-art, including heuristics. Our source code is available at https://github.com/orfeld415/NAVIS
academic

Revisiting Node Affinity Prediction in Temporal Graphs

基本信息

摘要

节点亲和性预测是时序图学习中的一项重要任务,广泛应用于社交网络、金融网络和推荐系统等领域。尽管最近的研究通过适配最先进的动态链接预测模型来解决节点亲和性预测任务,但简单的启发式方法(如持续预测和移动平均)却能超越这些复杂模型。本文分析了当前时序图神经网络在节点亲和性预测任务中的训练挑战,并提出了相应的解决方案。结合这些解决方案,作者开发了NAVIS(Node Affinity prediction model using Virtual State),通过利用启发式方法与状态空间模型的等价性来实现节点亲和性预测。

研究背景与动机

问题定义

节点亲和性预测旨在预测未来时刻某个节点与其他所有节点的交互强度,这与传统的链接预测任务不同。链接预测关注特定边是否会出现,而亲和性预测需要对所有潜在邻居进行完整排序,这使得任务更具挑战性但也更贴近实际应用需求。

核心问题

  1. 性能悖论:复杂的时序图神经网络(TGNNs)在节点亲和性预测任务上表现不如简单的启发式方法
  2. 表达能力限制:现有TGNNs无法表示简单的移动平均等基础操作
  3. 损失函数不匹配:交叉熵损失与排序性质的亲和性任务不匹配
  4. 信息利用不充分:TGNNs未能充分利用全局时序动态和长期依赖信息

研究动机

作者通过理论分析发现,简单启发式方法实际上是线性状态空间模型(SSMs)的特例,这为设计更强大的TGNN架构提供了理论基础。

核心贡献

  1. 理论贡献:证明了简单启发式方法是线性SSMs的特例,并基于此连接设计了能够泛化启发式方法的TGNN架构
  2. 架构创新:提出NAVIS模型,结合虚拟全局状态和线性状态空间机制,有效解决节点亲和性预测问题
  3. 损失函数改进:分析了交叉熵损失在亲和性预测中的不足,提出了基于排序的Lambda损失替代方案
  4. 实验验证:在TGB基准和多个数据集上验证了方法的有效性,consistently超越现有方法和启发式基线

方法详解

任务定义

给定连续时间动态图(CTDG): Gt={(uj,vj,τj,wj)}j=1J(t)G_t = \{(u_j, v_j, \tau_j, w_j)\}_{j=1}^{J(t)}

对于查询节点 uVu \in V 和未来时刻 t+>tt^+ > t,目标是预测亲和性分数向量: s=Fθ(u,Gt,t+)RVs = F_\theta(u, G_t, t^+) \in \mathbb{R}^{|V|}

理论基础

定理1(线性SSMs泛化基础启发式): 设 HH 为基础启发式集合(PF, SMA, EMA),Flin-SSMF_{\text{lin-SSM}} 为线性SSM可实现的映射集合,则: HFlin-SSMH \subsetneq F_{\text{lin-SSM}}

定理2(RNN/LSTM/GRU的表达限制): 标准的RNN、LSTM或GRU单元无法表示最基本的持续预测(PF)启发式,即对于所有输入序列,不存在参数使得 hi=xih_i = x_i

NAVIS采用线性状态空间机制维护每个节点的状态 hRdh \in \mathbb{R}^d 和虚拟全局状态 gRdg \in \mathbb{R}^d

zh = σ(Wxh*x + Whh*hi-1 + bh)
hi = zh ⊙ hi-1 + (1-zh) ⊙ x
zs = σ(Wxs*x + Whs*hi + Wgs*g + bs)  
s = zs ⊙ hi + (1-zs) ⊙ x

其中:

  • xx:前一亲和性向量
  • hi1,hih_{i-1}, h_i:前一状态和更新状态
  • gg:虚拟全局向量
  • ss:预测亲和性向量
  • zh,zsz_h, z_s:自适应门控机制

关键设计特点

  1. 线性更新机制:保持与EMA的概念相似性,但允许运行时自适应调整
  2. 虚拟全局状态:通过维护最近亲和性向量缓冲区捕获全局趋势
  3. 兼容t-Batch机制:不依赖邻居隐状态,支持高效批处理
  4. 可扩展性:通过稀疏化亲和性预测管道适应大规模图

损失函数设计

问题分析定理3(交叉熵对排序的次优性):存在无穷多个三元组 (y,s1,s2)(y, s_1, s_2),其中 rank(s1)=rank(y)\text{rank}(s_1) = \text{rank}(y)rank(s2)rank(y)\text{rank}(s_2) \neq \text{rank}(y),但 CE(s1,y)>CE(s2,y)\ell_{CE}(s_1, y) > \ell_{CE}(s_2, y)

解决方案:采用Lambda损失: Lambda(s,y)=yi>yjlog2(11+eσ(sπisπj))δijAπiAπj\ell_{\text{Lambda}}(s,y) = \sum_{y_i > y_j} \log_2\left(\frac{1}{1 + e^{-\sigma(s_{\pi_i} - s_{\pi_j})}}\right) \delta_{ij} |A_{\pi_i} - A_{\pi_j}|

并结合成对边际正则化: Reg(s,y)=yi>yjmax(0,(sπisπj)+Δ)\ell_{\text{Reg}}(s,y) = \sum_{y_i > y_j} \max(0, -(s_{\pi_i} - s_{\pi_j}) + \Delta)

实验设置

数据集

TGB数据集

  • tgbn-trade:1986-2016年UN国家间农业贸易网络(255节点,468,245边)
  • tgbn-genre:用户-音乐类型交互网络(1,505节点,17,858,395边)
  • tgbn-reddit:用户-subreddit交互网络(11,766节点,27,174,118边)
  • tgbn-token:钱包-加密货币代币交互网络(61,756节点,72,936,998边)

转换的链接预测数据集

  • Wikipedia:编辑者-文章交互网络
  • Flights:COVID-19期间机场路线网络
  • USLegis:美国参议院合作网络
  • UNVote:联合国大会投票网络

评价指标

  • 主要指标:NDCG@10(Normalized Discounted Cumulative Gain)
  • 实验设置:70%-15%-15%时序划分,50个epoch,批大小200

对比方法

  • 启发式方法:Persistent Forecast, Moving Average, Historical Average
  • TGNN方法:JODIE, TGAT, CAWN, TCL, GraphMixer, DyGFormer, DyRep, TGN, TGNv2

实验结果

主要结果

TGB数据集表现(NDCG@10):

  • tgbn-trade: NAVIS 0.863 vs 最佳基线TGNv2 0.735 (+17.4%)
  • tgbn-genre: NAVIS 0.520 vs 最佳基线TGNv2 0.469 (+10.9%)
  • tgbn-reddit: NAVIS 0.552 vs 最佳基线TGNv2 0.507 (+8.9%)
  • tgbn-token: NAVIS 0.444 vs 最佳基线TGNv2 0.294 (+51.0%)

转换数据集表现

  • Wikipedia: NAVIS 0.573 vs TGNv2 0.433 (+32.3%)
  • Flights: NAVIS 0.499 vs TGNv2 0.299 (+66.9%)
  • USLegis: NAVIS 0.347 vs TGNv2 0.253 (+37.2%)
  • UNVote: NAVIS 0.952 vs TGNv2 0.813 (+17.1%)

消融实验

消融研究验证了各组件的重要性:

  • 线性状态更新 vs GRU:在tgbn-trade上0.863 vs 0.850
  • 包含全局向量:提升约1-2个百分点
  • 排序损失 vs 交叉熵:显著提升性能

关键发现

  1. 启发式优势确认:简单启发式方法确实优于复杂TGNNs
  2. 全局信息重要性:虚拟全局状态有效捕获网络级趋势
  3. 损失函数匹配:排序感知损失对亲和性预测至关重要
  4. 一致性改进:NAVIS在所有数据集上都取得了consistent的改进

相关工作

时序图表达能力

传统研究关注WL测试衡量的结构表达能力,本文则关注功能表达能力,即表示特定数学操作的能力。

启发式方法与状态空间模型

近期研究发现简单启发式方法在多个基准上优于复杂TGNNs,本文首次明确利用启发式与SSMs的形式等价性来设计架构。

时序图神经网络

现有方法包括基于记忆的(TGN, DyRep)和非记忆的(DyGFormer, GraphMixer)架构,但都无法有效处理节点亲和性预测的特殊需求。

结论与讨论

主要结论

  1. 现有TGNNs在节点亲和性预测上的不足源于表达能力限制和训练目标不匹配
  2. 线性状态空间模型提供了泛化启发式方法的理论框架
  3. NAVIS通过结合虚拟全局状态和排序感知损失,有效解决了节点亲和性预测问题

局限性

  1. 复杂依赖建模:仍然难以建模复杂的多跳依赖关系
  2. 可扩展性:参数规模随节点数线性增长,需要稀疏化策略
  3. 理论完整性:尚未完全解决所有相关问题

未来方向

  1. 扩展到更复杂的时序依赖建模
  2. 提高大规模图的可扩展性
  3. 探索非线性状态空间模型的可能性

深度评价

优点

  1. 理论贡献扎实:通过严格的数学证明建立了启发式方法与SSMs的联系
  2. 问题分析深入:系统分析了TGNNs在节点亲和性预测上的不足
  3. 方法设计合理:NAVIS的设计有明确的理论依据和实用考虑
  4. 实验充分:在多个数据集上的extensive实验验证了方法的有效性
  5. 写作清晰:论文结构清晰,技术细节描述准确

不足

  1. 创新程度有限:主要是将现有理论(SSMs)应用到新问题域
  2. 实验设置:部分数据集规模相对较小,大规模实验有限
  3. 比较公平性:与基线方法的比较可能存在实现差异
  4. 泛化能力:需要更多不同类型图的验证

影响力

  1. 学术价值:为时序图学习提供了新的理论视角
  2. 实用价值:在推荐系统等实际应用中有直接价值
  3. 可复现性:提供了完整的代码实现
  4. 启发性:为后续研究提供了有价值的思路

适用场景

  1. 推荐系统:用户对物品的亲和性预测
  2. 社交网络:用户交互强度预测
  3. 金融网络:交易关系强度预测
  4. 供应链网络:合作关系预测

总体评价:这是一篇质量较高的研究论文,通过深入的理论分析揭示了现有方法的不足,并提出了有效的解决方案。NAVIS模型设计合理,实验结果convincing,对时序图学习领域有积极贡献。论文的主要价值在于提供了新的理论视角和实用的方法框架。