2025-11-14T22:58:11.335175

Revisiting Node Affinity Prediction in Temporal Graphs

Mantri, Feldman, Eliasof et al.
Node affinity prediction is a common task that is widely used in temporal graph learning with applications in social and financial networks, recommender systems, and more. Recent works have addressed this task by adapting state-of-the-art dynamic link property prediction models to node affinity prediction. However, simple heuristics, such as Persistent Forecast or Moving Average, outperform these models. In this work, we analyze the challenges in training current Temporal Graph Neural Networks for node affinity prediction and suggest appropriate solutions. Combining the solutions, we develop NAViS - Node Affinity prediction model using Virtual State, by exploiting the equivalence between heuristics and state space models. While promising, training NAViS is non-trivial. Therefore, we further introduce a novel loss function for node affinity prediction. We evaluate NAViS on TGB and show that it outperforms the state-of-the-art, including heuristics. Our source code is available at https://github.com/orfeld415/NAVIS
academic

시간 그래프에서의 노드 친화성 예측 재검토

기본 정보

초록

노드 친화성 예측은 시간 그래프 학습에서 중요한 작업으로, 소셜 네트워크, 금융 네트워크 및 추천 시스템 등 다양한 분야에 광범위하게 적용됩니다. 최근 연구에서는 최첨단 동적 링크 예측 모델을 적응시켜 노드 친화성 예측 작업을 해결하려고 했지만, 지속 예측 및 이동 평균과 같은 단순한 휴리스틱 방법이 이러한 복잡한 모델을 능가합니다. 본 논문은 노드 친화성 예측 작업에서 현재 시간 그래프 신경망의 훈련 과제를 분석하고 해당 해결책을 제시합니다. 이러한 해결책들을 결합하여, 저자들은 휴리스틱 방법과 상태 공간 모델의 동등성을 활용하여 노드 친화성 예측을 구현하는 NAVIS(가상 상태를 사용한 노드 친화성 예측 모델)를 개발했습니다.

연구 배경 및 동기

문제 정의

노드 친화성 예측은 미래 시점에서 특정 노드와 다른 모든 노드 간의 상호작용 강도를 예측하는 것을 목표로 하며, 이는 전통적인 링크 예측 작업과 다릅니다. 링크 예측은 특정 간선의 출현 여부에 중점을 두는 반면, 친화성 예측은 모든 잠재적 이웃에 대한 완전한 순위 지정이 필요하므로 작업이 더 도전적이면서도 실제 응용 요구에 더 부합합니다.

핵심 문제

  1. 성능 역설: 복잡한 시간 그래프 신경망(TGNNs)이 노드 친화성 예측 작업에서 단순한 휴리스틱 방법보다 성능이 떨어짐
  2. 표현 능력 제한: 기존 TGNNs는 이동 평균 같은 기본 연산을 표현할 수 없음
  3. 손실 함수 불일치: 교차 엔트로피 손실이 순위 특성의 친화성 작업과 맞지 않음
  4. 정보 활용 부족: TGNNs가 전역 시간 동역학 및 장기 의존성 정보를 충분히 활용하지 못함

연구 동기

저자들은 이론적 분석을 통해 단순한 휴리스틱 방법이 실제로 선형 상태 공간 모델(SSMs)의 특수한 경우임을 발견했으며, 이는 더 강력한 TGNN 아키텍처 설계를 위한 이론적 기초를 제공합니다.

핵심 기여

  1. 이론적 기여: 단순한 휴리스틱 방법이 선형 SSMs의 특수한 경우임을 증명하고, 이 연결을 기반으로 휴리스틱 방법을 일반화할 수 있는 TGNN 아키텍처 설계
  2. 아키텍처 혁신: 가상 전역 상태와 선형 상태 공간 메커니즘을 결합하여 노드 친화성 예측 문제를 효과적으로 해결하는 NAVIS 모델 제시
  3. 손실 함수 개선: 친화성 예측에서 교차 엔트로피 손실의 부족함을 분석하고 순위 기반 Lambda 손실 대안 제시
  4. 실험 검증: TGB 벤치마크 및 여러 데이터셋에서 방법의 효과성을 검증하여 기존 방법 및 휴리스틱 기준선을 지속적으로 초과

방법론 상세 설명

작업 정의

연속 시간 동적 그래프(CTDG)가 주어졌을 때: Gt={(uj,vj,τj,wj)}j=1J(t)G_t = \{(u_j, v_j, \tau_j, w_j)\}_{j=1}^{J(t)}

쿼리 노드 uVu \in V와 미래 시점 t+>tt^+ > t에 대해, 친화성 점수 벡터를 예측하는 것이 목표입니다: s=Fθ(u,Gt,t+)RVs = F_\theta(u, G_t, t^+) \in \mathbb{R}^{|V|}

이론적 기초

정리 1 (선형 SSMs이 기본 휴리스틱을 일반화): HH를 기본 휴리스틱 집합(PF, SMA, EMA)이라 하고, Flin-SSMF_{\text{lin-SSM}}을 선형 SSM이 구현 가능한 매핑 집합이라 하면: HFlin-SSMH \subsetneq F_{\text{lin-SSM}}

정리 2 (RNN/LSTM/GRU의 표현 제한): 표준 RNN, LSTM 또는 GRU 단위는 가장 기본적인 지속 예측(PF) 휴리스틱을 표현할 수 없으며, 즉 모든 입력 수열에 대해 hi=xih_i = x_i가 되도록 하는 매개변수가 존재하지 않습니다.

NAVIS는 선형 상태 공간 메커니즘을 사용하여 각 노드의 상태 hRdh \in \mathbb{R}^d와 가상 전역 상태 gRdg \in \mathbb{R}^d를 유지합니다:

zh = σ(Wxh*x + Whh*hi-1 + bh)
hi = zh ⊙ hi-1 + (1-zh) ⊙ x
zs = σ(Wxs*x + Whs*hi + Wgs*g + bs)  
s = zs ⊙ hi + (1-zs) ⊙ x

여기서:

  • xx: 이전 친화성 벡터
  • hi1,hih_{i-1}, h_i: 이전 상태 및 업데이트된 상태
  • gg: 가상 전역 벡터
  • ss: 예측된 친화성 벡터
  • zh,zsz_h, z_s: 적응형 게이팅 메커니즘

주요 설계 특징

  1. 선형 업데이트 메커니즘: EMA와의 개념적 유사성을 유지하면서 런타임 적응형 조정 허용
  2. 가상 전역 상태: 최근 친화성 벡터 버퍼를 유지하여 전역 추세 포착
  3. t-Batch 메커니즘 호환성: 이웃 숨겨진 상태에 의존하지 않아 효율적인 배치 처리 지원
  4. 확장성: 친화성 예측 파이프라인의 희소화를 통해 대규모 그래프에 적응

손실 함수 설계

문제 분석: 정리 3 (순위에 대한 교차 엔트로피의 차선성): 무한히 많은 삼중항 (y,s1,s2)(y, s_1, s_2)가 존재하여 rank(s1)=rank(y)\text{rank}(s_1) = \text{rank}(y)이고 rank(s2)rank(y)\text{rank}(s_2) \neq \text{rank}(y)이지만 CE(s1,y)>CE(s2,y)\ell_{CE}(s_1, y) > \ell_{CE}(s_2, y)입니다.

해결책: Lambda 손실 사용: Lambda(s,y)=yi>yjlog2(11+eσ(sπisπj))δijAπiAπj\ell_{\text{Lambda}}(s,y) = \sum_{y_i > y_j} \log_2\left(\frac{1}{1 + e^{-\sigma(s_{\pi_i} - s_{\pi_j})}}\right) \delta_{ij} |A_{\pi_i} - A_{\pi_j}|

쌍별 마진 정규화와 결합: Reg(s,y)=yi>yjmax(0,(sπisπj)+Δ)\ell_{\text{Reg}}(s,y) = \sum_{y_i > y_j} \max(0, -(s_{\pi_i} - s_{\pi_j}) + \Delta)

실험 설정

데이터셋

TGB 데이터셋:

  • tgbn-trade: 1986-2016년 UN 국가 간 농업 무역 네트워크(255개 노드, 468,245개 간선)
  • tgbn-genre: 사용자-음악 장르 상호작용 네트워크(1,505개 노드, 17,858,395개 간선)
  • tgbn-reddit: 사용자-subreddit 상호작용 네트워크(11,766개 노드, 27,174,118개 간선)
  • tgbn-token: 지갑-암호화폐 토큰 상호작용 네트워크(61,756개 노드, 72,936,998개 간선)

변환된 링크 예측 데이터셋:

  • Wikipedia: 편집자-문서 상호작용 네트워크
  • Flights: COVID-19 기간 공항 노선 네트워크
  • USLegis: 미국 상원 협력 네트워크
  • UNVote: 유엔 총회 투표 네트워크

평가 지표

  • 주요 지표: NDCG@10(정규화된 할인 누적 이득)
  • 실험 설정: 70%-15%-15% 시간 분할, 50개 에포크, 배치 크기 200

비교 방법

  • 휴리스틱 방법: 지속 예측, 이동 평균, 역사적 평균
  • TGNN 방법: JODIE, TGAT, CAWN, TCL, GraphMixer, DyGFormer, DyRep, TGN, TGNv2

실험 결과

주요 결과

TGB 데이터셋 성능(NDCG@10):

  • tgbn-trade: NAVIS 0.863 vs 최고 기준선 TGNv2 0.735 (+17.4%)
  • tgbn-genre: NAVIS 0.520 vs 최고 기준선 TGNv2 0.469 (+10.9%)
  • tgbn-reddit: NAVIS 0.552 vs 최고 기준선 TGNv2 0.507 (+8.9%)
  • tgbn-token: NAVIS 0.444 vs 최고 기준선 TGNv2 0.294 (+51.0%)

변환된 데이터셋 성능:

  • Wikipedia: NAVIS 0.573 vs TGNv2 0.433 (+32.3%)
  • Flights: NAVIS 0.499 vs TGNv2 0.299 (+66.9%)
  • USLegis: NAVIS 0.347 vs TGNv2 0.253 (+37.2%)
  • UNVote: NAVIS 0.952 vs TGNv2 0.813 (+17.1%)

제거 실험

제거 연구는 각 구성 요소의 중요성을 검증했습니다:

  • 선형 상태 업데이트 vs GRU: tgbn-trade에서 0.863 vs 0.850
  • 전역 벡터 포함: 약 1-2 백분포인트 향상
  • 순위 손실 vs 교차 엔트로피: 성능 현저히 향상

주요 발견

  1. 휴리스틱 우월성 확인: 단순한 휴리스틱 방법이 실제로 복잡한 TGNNs보다 우수함
  2. 전역 정보의 중요성: 가상 전역 상태가 네트워크 수준 추세를 효과적으로 포착
  3. 손실 함수 일치: 순위 인식 손실이 친화성 예측에 매우 중요함
  4. 일관된 개선: NAVIS가 모든 데이터셋에서 일관된 개선 달성

관련 연구

시간 그래프 표현 능력

전통적 연구는 WL 테스트로 측정한 구조적 표현 능력에 중점을 두었지만, 본 논문은 특정 수학 연산을 표현하는 능력인 함수형 표현 능력에 중점을 둡니다.

휴리스틱 방법과 상태 공간 모델

최근 연구에서 단순한 휴리스틱 방법이 여러 벤치마크에서 복잡한 TGNNs보다 우수함을 발견했으며, 본 논문은 처음으로 휴리스틱과 SSMs의 형식적 동등성을 명시적으로 활용하여 아키텍처를 설계합니다.

시간 그래프 신경망

기존 방법에는 메모리 기반(TGN, DyRep) 및 비메모리 기반(DyGFormer, GraphMixer) 아키텍처가 포함되지만, 모두 노드 친화성 예측의 특수한 요구를 효과적으로 처리하지 못합니다.

결론 및 논의

주요 결론

  1. 노드 친화성 예측에서 기존 TGNNs의 부족함은 표현 능력 제한 및 훈련 목표 불일치에서 비롯됨
  2. 선형 상태 공간 모델은 휴리스틱 방법을 일반화하기 위한 이론적 프레임워크 제공
  3. NAVIS는 가상 전역 상태와 순위 인식 손실을 결합하여 노드 친화성 예측 문제를 효과적으로 해결

제한 사항

  1. 복잡한 의존성 모델링: 여전히 복잡한 다중 홉 의존성 관계 모델링이 어려움
  2. 확장성: 매개변수 규모가 노드 수에 따라 선형적으로 증가하여 희소화 전략 필요
  3. 이론적 완전성: 모든 관련 문제를 완전히 해결하지 못함

향후 방향

  1. 더 복잡한 시간 의존성 모델링으로 확장
  2. 대규모 그래프의 확장성 향상
  3. 비선형 상태 공간 모델의 가능성 탐색

심층 평가

장점

  1. 견고한 이론적 기여: 엄격한 수학적 증명을 통해 휴리스틱 방법과 SSMs의 연결 구축
  2. 심층적 문제 분석: 노드 친화성 예측에서 TGNNs의 부족함을 체계적으로 분석
  3. 합리적 방법 설계: NAVIS의 설계가 명확한 이론적 근거와 실용적 고려를 가짐
  4. 충분한 실험: 여러 데이터셋에서의 광범위한 실험이 방법의 효과성 검증
  5. 명확한 작성: 논문 구조가 명확하고 기술 세부사항이 정확하게 설명됨

부족한 점

  1. 제한된 혁신성: 주로 기존 이론(SSMs)을 새로운 문제 영역에 적용
  2. 실험 설정: 일부 데이터셋 규모가 상대적으로 작고 대규모 실험이 제한적
  3. 비교 공정성: 기준선 방법과의 비교에서 구현 차이 가능성
  4. 일반화 능력: 다양한 유형의 그래프에 대한 더 많은 검증 필요

영향력

  1. 학술적 가치: 시간 그래프 학습에 새로운 이론적 관점 제공
  2. 실용적 가치: 추천 시스템 등 실제 응용에서 직접적 가치
  3. 재현성: 완전한 코드 구현 제공
  4. 영감: 후속 연구에 가치 있는 아이디어 제공

적용 시나리오

  1. 추천 시스템: 사용자의 항목에 대한 친화성 예측
  2. 소셜 네트워크: 사용자 상호작용 강도 예측
  3. 금융 네트워크: 거래 관계 강도 예측
  4. 공급망 네트워크: 협력 관계 예측

전체 평가: 이는 높은 품질의 연구 논문으로, 심층적인 이론 분석을 통해 기존 방법의 부족함을 밝히고 효과적인 해결책을 제시합니다. NAVIS 모델은 합리적으로 설계되었으며, 실험 결과가 설득력 있고, 시간 그래프 학습 분야에 긍정적인 기여를 합니다. 논문의 주요 가치는 새로운 이론적 관점과 실용적인 방법 프레임워크를 제공하는 데 있습니다.