2025-11-13T20:01:11.522868

Self-Exploring Language Models for Explainable Link Forecasting on Temporal Graphs via Reinforcement Learning

Ding, Huang, Cao et al.
Forecasting future links is a central task in temporal graph (TG) reasoning, requiring models to leverage historical interactions to predict upcoming ones. Traditional neural approaches, such as temporal graph neural networks, achieve strong performance but lack explainability and cannot be applied to unseen graphs without retraining. Recent studies have begun to explore using large language models (LLMs) for graph reasoning, but most of them are constrained to static graphs or small synthetic TGs and lack the evaluation of the quality of reasoning traces generated by LLMs. In this work, we present Reasoning-Enhanced Learning for Temporal Graphs (ReaL-TG), a reinforcement learning framework that fine-tunes LLMs to perform explainable link forecasting on real-world TGs. ReaL-TG uses outcome-based reward to encourage models to self-explore reasoning strategies from graph structure and to produce explanations that directly justify their predictions. To enable evaluation on LLM-generated reasoning traces, we propose a new evaluation protocol combining ranking metrics with an LLM-as-a-Judge system that assesses both the quality of reasoning and the impact of hallucinations. Experiments with ReaL-TG-4B, obtained by fine-tuning Qwen3-4B under our framework, show that it outperforms much larger frontier LLMs, including GPT-5 mini, on ranking metrics, while producing high-quality explanations confirmed by both the LLM judge and human evaluation.
academic

рд╕реБрджреГрдврд╝ рднрд╛рд╖рд╛ рдореЙрдбрд▓ рджреНрд╡рд╛рд░рд╛ рд╕реБрджреГрдврд╝ рдЕрдзрд┐рдЧрдо рдХреЗ рдорд╛рдзреНрдпрдо рд╕реЗ рдЕрд╕реНрдерд╛рдпреА рдЧреНрд░рд╛рдлрд╝ рдкрд░ рд╡реНрдпрд╛рдЦреНрдпрд╛рдпреЛрдЧреНрдп рд▓рд┐рдВрдХ рдкреВрд░реНрд╡рд╛рдиреБрдорд╛рди

рдореВрд▓ рдЬрд╛рдирдХрд╛рд░реА

  • рдкреЗрдкрд░ ID: 2509.00975
  • рд╢реАрд░реНрд╖рдХ: Self-Exploring Language Models for Explainable Link Forecasting on Temporal Graphs via Reinforcement Learning
  • рд▓реЗрдЦрдХ: Zifeng Ding, Shenyang Huang, Zeyu Cao, Emma Kondrup, Zachary Yang, Xingyue Huang, Yuan Sui, Zhangdie Yuan, Yuqicheng Zhu, Xianglong Hu, Yuan He, Farimah Poursafaei, Michael Bronstein, Andreas Vlachos
  • рд╡рд░реНрдЧреАрдХрд░рдг: cs.AI cs.CL cs.LG
  • рдкреНрд░рдХрд╛рд╢рди рддрд┐рдерд┐: 13 рдЕрдХреНрдЯреВрдмрд░ 2025 (arXiv рдкреНрд░реАрдкреНрд░рд┐рдВрдЯ)
  • рдкреЗрдкрд░ рд▓рд┐рдВрдХ: https://arxiv.org/abs/2509.00975v2

рд╕рд╛рд░рд╛рдВрд╢

рдЕрд╕реНрдерд╛рдпреА рдЧреНрд░рд╛рдлрд╝ (TG) рдореЗрдВ рд▓рд┐рдВрдХ рдкреВрд░реНрд╡рд╛рдиреБрдорд╛рди рдПрдХ рдореБрдЦреНрдп рдХрд╛рд░реНрдп рд╣реИ рдЬрд┐рд╕рдХреЗ рд▓рд┐рдП рдореЙрдбрд▓ рдХреЛ рдРрддрд┐рд╣рд╛рд╕рд┐рдХ рдЕрдВрддрдГрдХреНрд░рд┐рдпрд╛рдУрдВ рдХрд╛ рдЙрдкрдпреЛрдЧ рдХрд░рдХреЗ рднрд╡рд┐рд╖реНрдп рдХреЗ рдХрдиреЗрдХреНрд╢рди рдХреА рднрд╡рд┐рд╖реНрдпрд╡рд╛рдгреА рдХрд░рдиреА рд╣реЛрддреА рд╣реИред рдкрд╛рд░рдВрдкрд░рд┐рдХ рддрдВрддреНрд░рд┐рдХрд╛ рдиреЗрдЯрд╡рд░реНрдХ рд╡рд┐рдзрд┐рдпрд╛рдБ рд╢рдХреНрддрд┐рд╢рд╛рд▓реА рдкреНрд░рджрд░реНрд╢рди рдкреНрд░рджрд╛рди рдХрд░рддреА рд╣реИрдВ рд▓реЗрдХрд┐рди рд╡реНрдпрд╛рдЦреНрдпрд╛рдпреЛрдЧреНрдпрддрд╛ рдХреА рдХрдореА рд╣реИ рдФрд░ рдкреБрдирдГ рдкреНрд░рд╢рд┐рдХреНрд╖рдг рдХреЗ рдмрд┐рдирд╛ рдЕрджреЗрдЦреЗ рдЧреНрд░рд╛рдлрд╝ рдкрд░ рд▓рд╛рдЧреВ рдирд╣реАрдВ рдХреА рдЬрд╛ рд╕рдХрддреАрдВред рдпрд╣ рдкреЗрдкрд░ ReaL-TG (Reasoning-Enhanced Learning for Temporal Graphs) рдкреНрд░рд╕реНрддрд╛рд╡рд┐рдд рдХрд░рддрд╛ рд╣реИ, рдЬреЛ рдПрдХ рд╕реБрджреГрдврд╝ рдЕрдзрд┐рдЧрдо рдврд╛рдВрдЪрд╛ рд╣реИ рдЬреЛ рдмрдбрд╝реЗ рднрд╛рд╖рд╛ рдореЙрдбрд▓ (LLM) рдХреЛ рд╕реВрдХреНрд╖реНрдо-рд╕рдорд╛рдпреЛрдЬрд┐рдд рдХрд░рдХреЗ рд╡реНрдпрд╛рдЦреНрдпрд╛рдпреЛрдЧреНрдп рдЕрд╕реНрдерд╛рдпреА рдЧреНрд░рд╛рдлрд╝ рд▓рд┐рдВрдХ рдкреВрд░реНрд╡рд╛рдиреБрдорд╛рди рдХрд░рдиреЗ рдореЗрдВ рд╕рдХреНрд╖рдо рдмрдирд╛рддрд╛ рд╣реИред ReaL-TG рдкрд░рд┐рдгрд╛рдо-рдЖрдзрд╛рд░рд┐рдд рдкреБрд░рд╕реНрдХрд╛рд░ рддрдВрддреНрд░ рдХрд╛ рдЙрдкрдпреЛрдЧ рдХрд░рддрд╛ рд╣реИ рдЬреЛ рдореЙрдбрд▓ рдХреЛ рдЧреНрд░рд╛рдлрд╝ рд╕рдВрд░рдЪрдирд╛ рд╕реЗ рд╕реНрд╡рд╛рдпрддреНрдд рд░реВрдк рд╕реЗ рддрд░реНрдХ рд░рдгрдиреАрддрд┐рдпреЛрдВ рдХреА рдЦреЛрдЬ рдХрд░рдиреЗ рдФрд░ рдЕрдкрдиреА рднрд╡рд┐рд╖реНрдпрд╡рд╛рдгрд┐рдпреЛрдВ рдХрд╛ рд╕рдорд░реНрдерди рдХрд░рдиреЗ рд╡рд╛рд▓реА рд╡реНрдпрд╛рдЦреНрдпрд╛рдПрдВ рдЙрддреНрдкрдиреНрди рдХрд░рдиреЗ рдХреЗ рд▓рд┐рдП рдкреНрд░реЛрддреНрд╕рд╛рд╣рд┐рдд рдХрд░рддрд╛ рд╣реИред рдкреНрд░рдпреЛрдЧ рджрд░реНрд╢рд╛рддреЗ рд╣реИрдВ рдХрд┐ ReaL-TG-4B рд░реИрдВрдХрд┐рдВрдЧ рдореЗрдЯреНрд░рд┐рдХреНрд╕ рдкрд░ GPT-5 mini рд╕рд╣рд┐рдд рдмрдбрд╝реЗ рдЕрдЧреНрд░рдгреА LLM рдХреЛ рдкрд╛рд░ рдХрд░рддрд╛ рд╣реИ, рд╕рд╛рде рд╣реА рдЙрдЪреНрдЪ рдЧреБрдгрд╡рддреНрддрд╛ рдХреА рд╡реНрдпрд╛рдЦреНрдпрд╛рдПрдВ рднреА рдкреНрд░рджрд╛рди рдХрд░рддрд╛ рд╣реИред

рдЕрдиреБрд╕рдВрдзрд╛рди рдкреГрд╖реНрдарднреВрдорд┐ рдФрд░ рдкреНрд░реЗрд░рдгрд╛

рд╕рдорд╕реНрдпрд╛ рдкрд░рд┐рднрд╛рд╖рд╛

рдЕрд╕реНрдерд╛рдпреА рдЧреНрд░рд╛рдлрд╝ рд▓рд┐рдВрдХ рдкреВрд░реНрд╡рд╛рдиреБрдорд╛рди рдРрддрд┐рд╣рд╛рд╕рд┐рдХ рдиреЛрдб рдЕрдВрддрдГрдХреНрд░рд┐рдпрд╛рдУрдВ рдХреЗ рдЖрдзрд╛рд░ рдкрд░ рднрд╡рд┐рд╖реНрдп рдХреЗ рдХрдиреЗрдХреНрд╢рди рд╕рдВрдмрдВрдзреЛрдВ рдХреА рднрд╡рд┐рд╖реНрдпрд╡рд╛рдгреА рдХрд░рдирд╛ рд╣реИред рдпрд╣ рдЕрдиреБрд╢рдВрд╕рд╛ рдкреНрд░рдгрд╛рд▓рд┐рдпреЛрдВ, рд╕рд╛рдореБрджрд╛рдпрд┐рдХ рдЦреЛрдЬ рдФрд░ рд╡рд┐рддреНрддреАрдп рд╡рд┐рд╢реНрд▓реЗрд╖рдг рдЬреИрд╕реЗ рд╡реНрдпрд╛рд╡рд╣рд╛рд░рд┐рдХ рдЕрдиреБрдкреНрд░рдпреЛрдЧреЛрдВ рдореЗрдВ рдорд╣рддреНрд╡рдкреВрд░реНрдг рдореВрд▓реНрдп рд░рдЦрддрд╛ рд╣реИред

рдореМрдЬреВрджрд╛ рд╡рд┐рдзрд┐рдпреЛрдВ рдХреА рд╕реАрдорд╛рдПрдВ

  1. рдкрд╛рд░рдВрдкрд░рд┐рдХ рддрдВрддреНрд░рд┐рдХрд╛ рд╡рд┐рдзрд┐рдпрд╛рдБ: рдЕрд╕реНрдерд╛рдпреА рдЧреНрд░рд╛рдлрд╝ рддрдВрддреНрд░рд┐рдХрд╛ рдиреЗрдЯрд╡рд░реНрдХ (TGNNs), рд╕реНрдореГрддрд┐ рдиреЗрдЯрд╡рд░реНрдХ рдЖрджрд┐ рдЕрдЪреНрдЫреЗ рдкрд░рд┐рдгрд╛рдо рджреЗрддреЗ рд╣реИрдВ рд▓реЗрдХрд┐рди рджреЛ рдорд╣рддреНрд╡рдкреВрд░реНрдг рд╕рдорд╕реНрдпрд╛рдПрдВ рд╣реИрдВ:
    • рдорд╛рдирд╡-рдкрдардиреАрдп рд╡реНрдпрд╛рдЦреНрдпрд╛рдУрдВ рдХреА рдХрдореА, рдкрд░рд┐рдгрд╛рдореЛрдВ рдХреА рд╡рд┐рд╢реНрд╡рд╕рдиреАрдпрддрд╛ рдХрд╛ рдЖрдХрд▓рди рдХрд░рдирд╛ рдХрдард┐рди рд╣реИ
    • рдирдП рдЧреНрд░рд╛рдлрд╝ рдкрд░ рд▓рд╛рдЧреВ рдХрд░рддреЗ рд╕рдордп рдкреБрдирдГ рдкреНрд░рд╢рд┐рдХреНрд╖рдг рдХреА рдЖрд╡рд╢реНрдпрдХрддрд╛, рдирд┐рд░реНрдмрд╛рдз рд╕рд╛рдорд╛рдиреНрдпреАрдХрд░рдг рдирд╣реАрдВ рд╣реЛ рд╕рдХрддрд╛
  2. рдореМрдЬреВрджрд╛ LLM рд╡рд┐рдзрд┐рдпрд╛рдБ:
    • рдЕрдзрд┐рдХрд╛рдВрд╢ рд╕реНрдерд┐рд░ рдЧреНрд░рд╛рдлрд╝ рдпрд╛ рдЫреЛрдЯреЗ рдкреИрдорд╛рдиреЗ рдХреЗ рд╕рд┐рдВрдереЗрдЯрд┐рдХ рдЕрд╕реНрдерд╛рдпреА рдЧреНрд░рд╛рдлрд╝ рддрдХ рд╕реАрдорд┐рдд рд╣реИрдВ
    • рдбреЗрдЯрд╛ рд░рд┐рд╕рд╛рд╡ рдХрд╛ рдЬреЛрдЦрд┐рдо (рдкрд╛рда рд╡рд┐рд╢реЗрд╖рддрд╛рдПрдВ рдкреВрд░реНрд╡-рдкреНрд░рд╢рд┐рдХреНрд╖рдг рдХреЗ рджреМрд░рд╛рди рджреЗрдЦреА рдЬрд╛ рд╕рдХрддреА рд╣реИрдВ)
    • LLM рджреНрд╡рд╛рд░рд╛ рдЙрддреНрдкрдиреНрди рддрд░реНрдХ рдкреНрд░рдХреНрд╖реЗрдкрд╡рдХреНрд░ рдХреА рдЧреБрдгрд╡рддреНрддрд╛ рдХрд╛ рдореВрд▓реНрдпрд╛рдВрдХрди рдирд╣реАрдВ

рдЕрдиреБрд╕рдВрдзрд╛рди рдкреНрд░реЗрд░рдгрд╛

рдпрд╣ рдкреЗрдкрд░ рдПрдХ рдРрд╕реА рд╡рд┐рдзрд┐ рд╡рд┐рдХрд╕рд┐рдд рдХрд░рдиреЗ рдХрд╛ рд▓рдХреНрд╖реНрдп рд░рдЦрддрд╛ рд╣реИ рдЬреЛ рдЙрдЪреНрдЪ рдЧреБрдгрд╡рддреНрддрд╛ рдХреА рднрд╡рд┐рд╖реНрдпрд╡рд╛рдгрд┐рдпрд╛рдБ рдкреНрд░рджрд╛рди рдХрд░реЗ рдФрд░ рд╡реНрдпрд╛рдЦреНрдпрд╛рдпреЛрдЧреНрдп рддрд░реНрдХ рдЙрддреНрдкрдиреНрди рдХрд░реЗ, рд╕рд╛рде рд╣реА рдбреЗрдЯрд╛ рд░рд┐рд╕рд╛рд╡ рд╕рдорд╕реНрдпрд╛ рд╕реЗ рдмрдЪреЗ рдФрд░ рдЕрджреЗрдЦреЗ рдЧреНрд░рд╛рдлрд╝ рдкрд░ рд╕рд╛рдорд╛рдиреНрдпреАрдХреГрдд рд╣реЛред

рдореБрдЦреНрдп рдпреЛрдЧрджрд╛рди

  1. ReaL-TG рдврд╛рдВрдЪрд╛ рдкреНрд░рд╕реНрддрд╛рд╡рд┐рдд рдХрд░рдирд╛: рдкрд╣рд▓рд╛ рдврд╛рдВрдЪрд╛ рдЬреЛ рд╕реБрджреГрдврд╝ рдЕрдзрд┐рдЧрдо рдХреЗ рдорд╛рдзреНрдпрдо рд╕реЗ LLM рдХреЛ рд╡рд╛рд╕реНрддрд╡рд┐рдХ рджреБрдирд┐рдпрд╛ рдХреЗ рдЕрд╕реНрдерд╛рдпреА рдЧреНрд░рд╛рдлрд╝ рдкрд░ рд╡реНрдпрд╛рдЦреНрдпрд╛рдпреЛрдЧреНрдп рдФрд░ рдкреНрд░рднрд╛рд╡реА рд▓рд┐рдВрдХ рдкреВрд░реНрд╡рд╛рдиреБрдорд╛рди рдХрд░рдиреЗ рдореЗрдВ рд╕рдХреНрд╖рдо рдмрдирд╛рддрд╛ рд╣реИ
  2. рдирдпрд╛ рдореВрд▓реНрдпрд╛рдВрдХрди рдкреНрд░реЛрдЯреЛрдХреЙрд▓: рд░реИрдВрдХрд┐рдВрдЧ рдореЗрдЯреНрд░рд┐рдХреНрд╕ рдФрд░ LLM-as-a-Judge рдкреНрд░рдгрд╛рд▓реА рдХреЛ рд╕рдВрдпреЛрдЬрд┐рдд рдХрд░рддрд╛ рд╣реИ, рдЬреЛ рди рдХреЗрд╡рд▓ рдкреВрд░реНрд╡рд╛рдиреБрдорд╛рди рд╕рдЯреАрдХрддрд╛ рдХрд╛ рдореВрд▓реНрдпрд╛рдВрдХрди рдХрд░рддрд╛ рд╣реИ рдмрд▓реНрдХрд┐ рддрд░реНрдХ рдЧреБрдгрд╡рддреНрддрд╛ рдФрд░ рднреНрд░рдо рдкреНрд░рднрд╛рд╡ рдХрд╛ рднреА рдореВрд▓реНрдпрд╛рдВрдХрди рдХрд░рддрд╛ рд╣реИ
  3. рдЙрддреНрдХреГрд╖реНрдЯ рдкреНрд░рд╛рдпреЛрдЧрд┐рдХ рдкрд░рд┐рдгрд╛рдо: ReaL-TG-4B рджреЗрдЦреЗ рдЧрдП рдФрд░ рдЕрджреЗрдЦреЗ рджреЛрдиреЛрдВ рдЧреНрд░рд╛рдлрд╝ рдкрд░ рдмрдбрд╝реЗ рдЕрдЧреНрд░рдгреА LLM рдХреЛ рдкрд╛рд░ рдХрд░рддрд╛ рд╣реИ, рдФрд░ LLM рдореВрд▓реНрдпрд╛рдВрдХрди рдФрд░ рдорд╛рдирд╡ рдореВрд▓реНрдпрд╛рдВрдХрди рджреНрд╡рд╛рд░рд╛ рдкреБрд╖реНрдЯрд┐ рдХреА рдЧрдИ рдЙрдЪреНрдЪ рдЧреБрдгрд╡рддреНрддрд╛ рдХреА рд╡реНрдпрд╛рдЦреНрдпрд╛рдПрдВ рдкреНрд░рджрд╛рди рдХрд░рддрд╛ рд╣реИ

рд╡рд┐рдзрд┐ рд╡рд┐рд╡рд░рдг

рдХрд╛рд░реНрдп рдкрд░рд┐рднрд╛рд╖рд╛

рдЕрд╕реНрдерд╛рдпреА рдЧреНрд░рд╛рдлрд╝ рдкрд░рд┐рднрд╛рд╖рд╛: рдЕрд╕реНрдерд╛рдпреА рдЧреНрд░рд╛рдлрд╝ G рдХреЛ рд╕рдордп-рдХреНрд░рдордмрджреНрдз рдЕрдВрддрдГрдХреНрд░рд┐рдпрд╛ рдЕрдиреБрдХреНрд░рдо рдХреЗ рд░реВрдк рдореЗрдВ рджрд░реНрд╢рд╛рдпрд╛ рдЬрд╛рддрд╛ рд╣реИ: G = {(ui, vi, ti)}, рдЬрд╣рд╛рдБ ui, vi рд╕реНрд░реЛрдд рдФрд░ рд▓рдХреНрд╖реНрдп рдиреЛрдб рд╣реИрдВ, ti рд╕рдордп рдореБрд╣рд░ рд╣реИред

QA-рд╢реИрд▓реА рд▓рд┐рдВрдХ рдкреВрд░реНрд╡рд╛рдиреБрдорд╛рди: рдХреНрд╡реЗрд░реА q = (uq, ?, tq) рдФрд░ рдЗрддрд┐рд╣рд╛рд╕ Htq рджрд┐рдпрд╛ рдЧрдпрд╛ рд╣реИ, LLM рдХреЛ рдкрд╛рда рдЙрддреНрддрд░ A рдЙрддреНрдкрдиреНрди рдХрд░рдирд╛ рд╣реЛрддрд╛ рд╣реИ рдЬреЛ рдкреВрд░реНрд╡рд╛рдиреБрдорд╛рдирд┐рдд рд▓рдХреНрд╖реНрдп рдиреЛрдб рд╕реЗрдЯ vq рдХреЛ рдирд┐рд░реНрджрд┐рд╖реНрдЯ рдХрд░рддрд╛ рд╣реИред

рдореЙрдбрд▓ рдЖрд░реНрдХрд┐рдЯреЗрдХреНрдЪрд░

1. рдЕрд╕реНрдерд╛рдпреА рд╕рдВрджрд░реНрдн рдЧреНрд░рд╛рдлрд╝ рдЪрдпрди (T-CGS)

  • ╬▒-рдЕрд╕реНрдерд╛рдпреА рдпрд╛рджреГрдЪреНрдЫрд┐рдХ рдЪрд▓рдирд╛ рдХрд╛ рдЙрдкрдпреЛрдЧ рдХрд░рдХреЗ рдХреНрд╡реЗрд░реА рдХреЗ рд╕рд╛рде рд╕рдмрд╕реЗ рдкреНрд░рд╛рд╕рдВрдЧрд┐рдХ рдЙрдк-рдЧреНрд░рд╛рдлрд╝ Gc рдХрд╛ рдирд┐рд░реНрдорд╛рдг рдХрд░рддрд╛ рд╣реИ
  • рдХреНрд╡реЗрд░реА рдиреЛрдб (uq, tq) рд╕реЗ рд╢реБрд░реВ рдХрд░рдХреЗ, рд╕рдВрднрд╛рд╡рдирд╛ ╬▒ рдХреЗ рд╕рд╛рде рд╕рдорд╛рдкреНрдд рдХрд░рддрд╛ рд╣реИ, рд╕рдВрднрд╛рд╡рдирд╛ 1-╬▒ рдХреЗ рд╕рд╛рде рдРрддрд┐рд╣рд╛рд╕рд┐рдХ рдкрдбрд╝реЛрд╕рд┐рдпреЛрдВ рдХреЛ рдЬрд╛рд░реА рд░рдЦрддрд╛ рд╣реИ
  • рд╕рдВрдХреНрд░рдордг рд╕рдВрднрд╛рд╡рдирд╛ рд╕рдордп рдХреНрд╖рдп рдкрд░ рд╡рд┐рдЪрд╛рд░ рдХрд░рддрд╛ рд╣реИ: P(e,t)(e', t') = ╬▓^|{...}|/тИС╬▓z, рд╕рдордп рдореЗрдВ рдХрд░реАрдм рдкрдбрд╝реЛрд╕рд┐рдпреЛрдВ рдХреЛ рдкреНрд░рд╛рдердорд┐рдХрддрд╛ рджреЗрддрд╛ рд╣реИ

2. рдкреНрд░реЙрдореНрдкреНрдЯ рдирд┐рд░реНрдорд╛рдг

рдЪрдпрдирд┐рдд рд╕рдВрджрд░реНрдн рдЧреНрд░рд╛рдлрд╝ Gc рдФрд░ рдХреНрд╡реЗрд░реА q рдХреЛ рдкреНрд░реЙрдореНрдкреНрдЯ Q рдореЗрдВ рд╕рдВрдпреЛрдЬрд┐рдд рдХрд░рддрд╛ рд╣реИ, LLM рдХреЛ рдЯреИрдЧ рдХреЗ рдЕрдВрджрд░ рддрд░реНрдХ рдЙрддреНрдкрдиреНрди рдХрд░рдиреЗ рдФрд░ рдЯреИрдЧ рдХреЗ рдЕрдВрджрд░ рднрд╡рд┐рд╖реНрдпрд╡рд╛рдгреА рджреЗрдиреЗ рдХреЗ рд▓рд┐рдП рдЖрд╡рд╢реНрдпрдХрддрд╛ рд╣реИред

3. рд╕реБрджреГрдврд╝ рдЕрдзрд┐рдЧрдо рдкреНрд░рд╢рд┐рдХреНрд╖рдг

  • рдкреБрд░рд╕реНрдХрд╛рд░ рдлрд▓рди: F1 рд╕реНрдХреЛрд░-рдЖрдзрд╛рд░рд┐рдд рдкрд░рд┐рдгрд╛рдо рдкреБрд░рд╕реНрдХрд╛рд░ r(O) = F1({a}, {vq}), рд╕рдЯреАрдХрддрд╛ рдФрд░ рдкреБрдирдГ рдкреНрд░рд╛рдкреНрддрд┐ рдХреЛ рд╕рдВрддреБрд▓рд┐рдд рдХрд░рддрд╛ рд╣реИ
  • рдЕрдиреБрдХреВрд▓рди рдЙрджреНрджреЗрд╢реНрдп: GRPO (Grouped Regularized Policy Optimization) рдХрд╛ рдЙрдкрдпреЛрдЧ рдХрд░рдХреЗ рдЙрджреНрджреЗрд╢реНрдп рдлрд▓рди рдХреЛ рдЕрдзрд┐рдХрддрдо рдХрд░рддрд╛ рд╣реИ:
JGRPO(╬╕) = E[1/g тИС(min(╧А╬╕(Oi,j|Q,Oi,<j)/╧А╬╕old(Oi,j|Q,Oi,<j) * Advi,j, 
                    clip(╧А╬╕(Oi,j|Q,Oi,<j)/╧А╬╕old(Oi,j|Q,Oi,<j), 1-╬╡, 1+╬╡) * Advi,j) 
                 - ╬│DKL(╧А╬╕||╧Аref))]

рддрдХрдиреАрдХреА рдирд╡рд╛рдЪрд╛рд░ рдмрд┐рдВрджреБ

  1. рдкрд░рд┐рдгрд╛рдо-рдЙрдиреНрдореБрдЦ рд╕реНрд╡-рдЕрдиреНрд╡реЗрд╖рдг: рдкреНрд░рдХреНрд░рд┐рдпрд╛-рд╕реНрддрд░реАрдп рдкрд░реНрдпрд╡реЗрдХреНрд╖рдг рдкрд░ рдирд┐рд░реНрднрд░ рдирд╣реАрдВ, рдкрд░рд┐рдгрд╛рдо рдкреБрд░рд╕реНрдХрд╛рд░ рдХреЗ рдорд╛рдзреНрдпрдо рд╕реЗ рдореЙрдбрд▓ рдХреЛ рд╕реНрд╡рд╛рдпрддреНрдд рд░реВрдк рд╕реЗ рдкреНрд░рднрд╛рд╡реА рддрд░реНрдХ рд░рдгрдиреАрддрд┐рдпреЛрдВ рдХреА рдЦреЛрдЬ рдХрд░рдиреЗ рджреЗрддрд╛ рд╣реИ
  2. рдЕрд╕реНрдерд╛рдпреА-рдЬрд╛рдЧрд░реВрдХ рд╕рдВрджрд░реНрдн рдЪрдпрди: T-CGS рдПрд▓реНрдЧреЛрд░рд┐рдереНрдо рд╕рдордп рдХреНрд╖рдп рдкрд░ рд╡рд┐рдЪрд╛рд░ рдХрд░рддрд╛ рд╣реИ, рд╕рдмрд╕реЗ рдкреНрд░рд╛рд╕рдВрдЧрд┐рдХ рдРрддрд┐рд╣рд╛рд╕рд┐рдХ рдЬрд╛рдирдХрд╛рд░реА рдХрд╛ рдЪрдпрди рдХрд░рддрд╛ рд╣реИ
  3. QA-рд╢реИрд▓реА рдкреВрд░реНрд╡рд╛рдиреБрдорд╛рди рдкреНрд░рддрд┐рдорд╛рди: рдкрд╛рд░рдВрдкрд░рд┐рдХ рджреНрд╡рд┐рдЖрдзрд╛рд░реА рд╡рд░реНрдЧреАрдХрд░рдг рд╡рд┐рдзрд┐ рдХреА рддреБрд▓рдирд╛ рдореЗрдВ, рдПрдХрд▓ рдЕрдЧреНрд░рдЧрд╛рдореА рдкрд╛рд╕ рд╕реАрдзреЗ рдкреВрд░реНрд╡рд╛рдиреБрдорд╛рдирд┐рдд рдиреЛрдб рдЖрдЙрдЯрдкреБрдЯ рдХрд░ рд╕рдХрддрд╛ рд╣реИ, рдХрдореНрдкреНрдпреВрдЯреЗрд╢рдирд▓ рд▓рд╛рдЧрдд рдореЗрдВ рднрд╛рд░реА рдХрдореА

рдкреНрд░рд╛рдпреЛрдЧрд┐рдХ рд╕реЗрдЯрдЕрдк

рдбреЗрдЯрд╛рд╕реЗрдЯ

TGB (Temporal Graph Benchmark) рдХреЗ 6 рдЕрдирд╛рдорд┐рдд рд╡рд╛рд╕реНрддрд╡рд┐рдХ рджреБрдирд┐рдпрд╛ рдбреЗрдЯрд╛рд╕реЗрдЯ рдХрд╛ рдЙрдкрдпреЛрдЧ:

  • рдкреНрд░рд╢рд┐рдХреНрд╖рдг рд╕реЗрдЯ: tgbl-wiki, tgbl-subreddit, tgbl-coin, tgbl-flight (рдХреБрд▓ 1000 рдХреНрд╡реЗрд░реА)
  • рдкрд░реАрдХреНрд╖рдг рд╕реЗрдЯ: рдЙрдкрд░реЛрдХреНрдд 4 (рджреЗрдЦреЗ рдЧрдП рдЧреНрд░рд╛рдлрд╝) + tgbl-uci, tgbl-enron (рдЕрджреЗрдЦреЗ рдЧреНрд░рд╛рдлрд╝, рдХреБрд▓ 4246 рдореВрд▓реНрдпрд╛рдВрдХрди рдирдореВрдиреЗ)

рдореВрд▓реНрдпрд╛рдВрдХрди рдореЗрдЯреНрд░рд┐рдХреНрд╕

рдкреВрд░реНрд╡рд╛рдиреБрдорд╛рди рд▓реЗрдмрд▓ рдореВрд▓реНрдпрд╛рдВрдХрди

  1. MRR (Mean Reciprocal Rank): рдорд╛рдирдХ рд░реИрдВрдХрд┐рдВрдЧ рдореЗрдЯреНрд░рд┐рдХ
  2. pMRR (Penalized MRR): рдирдпрд╛ рдкреНрд░рд╕реНрддрд╛рд╡рд┐рдд рдореЗрдЯреНрд░рд┐рдХ, рдЧрд▓рдд рдкреВрд░реНрд╡рд╛рдиреБрдорд╛рди рдиреЛрдб рдХреЛ рдЙрдЪреНрдЪ рд╕реНрдХреЛрд░ (1.1) рдЖрд╡рдВрдЯрд┐рдд рдХрд░рддрд╛ рд╣реИ, рдЕрддреНрдпрдзрд┐рдХ рдЙрддреНрдкрд╛рджрди рдХреЛ рджрдВрдбрд┐рдд рдХрд░рддрд╛ рд╣реИ

рддрд░реНрдХ рдкреНрд░рдХреНрд╖реЗрдкрд╡рдХреНрд░ рдореВрд▓реНрдпрд╛рдВрдХрди

GPT-4.1 mini рдХреЛ рдиреНрдпрд╛рдпрд╛рдзреАрд╢ рдХреЗ рд░реВрдк рдореЗрдВ рдЙрдкрдпреЛрдЧ рдХрд░рддрд╛ рд╣реИ, рддреАрди рдЖрдпрд╛рдореЛрдВ рдХрд╛ рдореВрд▓реНрдпрд╛рдВрдХрди рдХрд░рддрд╛ рд╣реИ:

  • рд╡рд┐рд╢реНрд╡рд╕рдиреАрдпрддрд╛ (╬┤f): рдХреНрдпрд╛ рддрд░реНрдХ рдЗрдирдкреБрдЯ рдЧреНрд░рд╛рдлрд╝ рд╕рдВрджрд░реНрдн рдкрд░ рдЖрдзрд╛рд░рд┐рдд рд╣реИ
  • рддрд╛рд░реНрдХрд┐рдХ рд╕реБрд╕рдВрдЧрддрддрд╛ (╬┤lc): рдХреНрдпрд╛ рддрд░реНрдХ рд╕реБрд╕рдВрдЧрдд рд╡реИрдз рддрд╛рд░реНрдХрд┐рдХ рд╢реНрд░реГрдВрдЦрд▓рд╛ рдХрд╛ рдкрд╛рд▓рди рдХрд░рддрд╛ рд╣реИ
  • рдЙрддреНрддрд░-рд╡реНрдпрд╛рдЦреНрдпрд╛ рд╕рдВрд░реЗрдЦрдг (╬┤a): рдХреНрдпрд╛ рдкреВрд░реНрд╡рд╛рдиреБрдорд╛рдирд┐рдд рдЙрддреНрддрд░ рдореЙрдбрд▓ рдХреЗ рд╕реНрд╡рдпрдВ рдХреЗ рддрд░реНрдХ рджреНрд╡рд╛рд░рд╛ рд╕рдорд░реНрдерд┐рдд рд╣реИ

рддреБрд▓рдирд╛рддреНрдордХ рд╡рд┐рдзрд┐рдпрд╛рдБ

  • рдЖрдзрд╛рд░ рдореЙрдбрд▓: Qwen3-0.6B/4B/8B, Gemma 3 4B/12B, GPT-5 mini, Llama3.3-70B
  • рдкрд╛рд░рдВрдкрд░рд┐рдХ рд╡рд┐рдзрд┐рдпрд╛рдБ: EdgeBank, TGN, DyGFormer, TNCN

рдХрд╛рд░реНрдпрд╛рдиреНрд╡рдпрди рд╡рд┐рд╡рд░рдг

  • рдЖрдзрд╛рд░ рдореЙрдбрд▓: Qwen3-4B
  • рдкреНрд░рд╢рд┐рдХреНрд╖рдг: 3 epoch, рдмреИрдЪ рдЖрдХрд╛рд░ 32, рд╕реАрдЦрдиреЗ рдХреА рджрд░ 2e-6
  • рд╣рд╛рд░реНрдбрд╡реЗрдпрд░: 4├ЧH100 GPU (80GB)

рдкреНрд░рд╛рдпреЛрдЧрд┐рдХ рдкрд░рд┐рдгрд╛рдо

рдореБрдЦреНрдп рдкрд░рд┐рдгрд╛рдо

рдкреВрд░реНрд╡рд╛рдиреБрдорд╛рди рд╕рдЯреАрдХрддрд╛ рддреБрд▓рдирд╛

MRR рдФрд░ pMRR рдореЗрдЯреНрд░рд┐рдХреНрд╕ рдкрд░, ReaL-TG-4B рд▓рдЧрднрдЧ рд╕рднреА рдбреЗрдЯрд╛рд╕реЗрдЯ рдкрд░ рд╕рднреА рдЖрдзрд╛рд░ рдореЙрдбрд▓ рдХреЛ рдкрд╛рд░ рдХрд░рддрд╛ рд╣реИ:

рдореЙрдбрд▓рдХреБрд▓ MRRрдХреБрд▓ pMRR
GPT-5 mini0.4560.351
Llama3.3-70B0.5210.423
Qwen3-4B0.3750.339
ReaL-TG-4B0.5520.508

рддрд░реНрдХ рдЧреБрдгрд╡рддреНрддрд╛ рддреБрд▓рдирд╛

ReaL-TG-4B рдЖрдзрд╛рд░ рдореЙрдбрд▓ рдХреА рддреБрд▓рдирд╛ рдореЗрдВ рддрд░реНрдХ рдЧреБрдгрд╡рддреНрддрд╛ рдореЗрдВ рдорд╣рддреНрд╡рдкреВрд░реНрдг рд╕реБрдзрд╛рд░:

рдореЙрдбрд▓╬┤╠Дf╬┤╠Дlc╬┤╠Дa
Qwen3-4B0.6830.7000.653
ReaL-TG-4B0.8850.8800.732

рд╡рд┐рд▓реЛрдкрди рдкреНрд░рдпреЛрдЧ

рдЖрдзрд╛рд░ рдореЙрдбрд▓ рдЖрдХрд╛рд░ рдкреНрд░рднрд╛рд╡

  • ReaL-TG-0.6B рдкреБрд░рд╕реНрдХрд╛рд░ рдзреЛрдЦрд╛рдзрдбрд╝реА рдХреА рдШрдЯрдирд╛ рджрд┐рдЦрд╛рддрд╛ рд╣реИ, рджрд╛рд╡рд╛ рдХрд░рддрд╛ рд╣реИ "рд▓рд┐рдВрдХ рдкрд╣рд▓реЗ рд╕реЗ рд╕рдВрджрд░реНрдн рдореЗрдВ рджреЗрдЦрд╛ рдЧрдпрд╛ рд╣реИ"
  • рдмрдбрд╝реЗ рдЖрдзрд╛рд░ рдореЙрдбрд▓ (4B рдмрдирд╛рдо 0.6B) рд╕реНрд╡рд╛рдпрддреНрдд рд░реВрдк рд╕реЗ рдЙрдЪреНрдЪ рд╕реНрддрд░реАрдп рддрд░реНрдХ рд░рдгрдиреАрддрд┐рдпреЛрдВ рдХреА рдЦреЛрдЬ рдХрд░ рд╕рдХрддреЗ рд╣реИрдВ

рдХреЗрд╕ рд╡рд┐рд╢реНрд▓реЗрд╖рдг

рдЧреБрдгрд╛рддреНрдордХ рд╡рд┐рд╢реНрд▓реЗрд╖рдг рдХреЗ рдорд╛рдзреНрдпрдо рд╕реЗ рдкрд╛рдпрд╛ рдЧрдпрд╛ рдХрд┐ RL рдкреНрд░рд╢рд┐рдХреНрд╖рдг рдХреЗ рдмрд╛рдж рдореЙрдбрд▓ рдЖрдзрд╛рд░ рдореЙрдбрд▓ рдХреА рддреБрд▓рдирд╛ рдореЗрдВ:

  1. рд╕рдВрджрд░реНрдн рд╡рд┐рдВрдбреЛ рдХреЛ рджреЛрд╣рд░рд╛рдП рдЧрдП рд╕рд╛рдордЧреНрд░реА рд╕реЗ рд╕рдорд╛рдкреНрдд рдХрд░рдирд╛ рдмрдВрдж рдХрд░рддрд╛ рд╣реИ
  2. рдЕрдВрддрдГрдХреНрд░рд┐рдпрд╛ рд╕рдордп рдирд┐рдХрдЯрддрд╛ рдХрд╛ рдЙрдкрдпреЛрдЧ рдХрд░рдХреЗ рдкреНрд░рднрд╛рд╡реА рднрд╡рд┐рд╖реНрдпрд╡рд╛рдгреА рдХрд░ рд╕рдХрддрд╛ рд╣реИ
  3. рдкреБрдирд░рд╛рд╡реГрддреНрддрд┐ рд╕реНрд╡-рдкреНрд░рддрд┐рдмрд┐рдВрдм рдХреЗ рдЬрд╛рд▓ рдХреЛ рдХрдо рдХрд░рддрд╛ рд╣реИ, рдордЬрдмреВрдд рддрд░реНрдХ рдЖрддреНрдорд╡рд┐рд╢реНрд╡рд╛рд╕ рджрд┐рдЦрд╛рддрд╛ рд╣реИ

рдорд╛рдирд╡ рдореВрд▓реНрдпрд╛рдВрдХрди рд╕рддреНрдпрд╛рдкрди

  • рддрд░реНрдХ рдЧреБрдгрд╡рддреНрддрд╛: 50 рдирдореВрдиреЛрдВ рдХрд╛ рдорд╛рдирд╡ рдореВрд▓реНрдпрд╛рдВрдХрди ╬┤╠Дf/╬┤╠Дlc/╬┤╠Дa рдХреЛ 0.885/0.872/0.839 рджрд┐рдЦрд╛рддрд╛ рд╣реИ, LLM рдореВрд▓реНрдпрд╛рдВрдХрди рдХреЗ рд╕рд╛рде рдЙрдЪреНрдЪ рд╕рд╣рдорддрд┐
  • рдиреНрдпрд╛рдпрд╛рдзреАрд╢ рдкреНрд░рдгрд╛рд▓реА рдЧреБрдгрд╡рддреНрддрд╛: LLM-as-a-Judge рдкреНрд░рдгрд╛рд▓реА рдХреА рдорд╛рдирд╡ рдореВрд▓реНрдпрд╛рдВрдХрди рдЧреБрдгрд╡рддреНрддрд╛ рдХреНрд░рдорд╢рдГ 1.71/1.88/1.71 (рдкреВрд░реНрдг рдЕрдВрдХ 2)

рд╕рдВрдмрдВрдзрд┐рдд рдХрд╛рд░реНрдп

рдкрд╛рд░рдВрдкрд░рд┐рдХ рд▓рд┐рдВрдХ рдкреВрд░реНрд╡рд╛рдиреБрдорд╛рди рд╡рд┐рдзрд┐рдпрд╛рдБ

  • рд╕реНрдореГрддрд┐ рдиреЗрдЯрд╡рд░реНрдХ: TGN, TNCN рдЖрджрд┐ рд╡рд┐рдХрд╕рд┐рдд рдиреЛрдб рд╕реНрдореГрддрд┐ рдмрдирд╛рдП рд░рдЦрддреЗ рд╣реИрдВ
  • рдЕрдиреБрдХреНрд░рдо рдореЙрдбрд▓рд┐рдВрдЧ: JODIE, TCL, DyGFormer рдЖрджрд┐ рдЕрд╕реНрдерд╛рдпреА рдЧрддрд┐рд╢реАрд▓рддрд╛ рдХреЛ рдореЙрдбрд▓ рдХрд░рдиреЗ рдХреЗ рд▓рд┐рдП RNN/Transformer рдХрд╛ рдЙрдкрдпреЛрдЧ рдХрд░рддреЗ рд╣реИрдВ
  • рдЕрдиреБрдорд╛рдиреА рд╡рд┐рдзрд┐рдпрд╛рдБ: EdgeBank рдЖрджрд┐ рд╕реАрдЦрдиреЗ рдпреЛрдЧреНрдп рдкреИрд░рд╛рдореАрдЯрд░ рд╕реЗ рдмрдЪрддреЗ рд╣реИрдВ
  • рд╕реНрдиреИрдкрд╢реЙрдЯ рд╡рд┐рдзрд┐рдпрд╛рдБ: ROLAND, UTG рдЖрджрд┐ рдорд╛рдирдХ GNN рдХреЛ рдЕрд╕реНрдерд╛рдпреА рдЧреНрд░рд╛рдлрд╝ рдореЗрдВ рдЕрдиреБрдХреВрд▓рд┐рдд рдХрд░рддреЗ рд╣реИрдВ

LLM рдЧреНрд░рд╛рдлрд╝ рддрд░реНрдХ

  • рд╕реНрдерд┐рд░ рдЧреНрд░рд╛рдлрд╝: GraphToken, GraphLLM, LLaGA рдЖрджрд┐
  • рдЕрд╕реНрдерд╛рдпреА рдЧреНрд░рд╛рдлрд╝: LLM4DyG (рдЫреЛрдЯреЗ рдкреИрдорд╛рдиреЗ рдХреЗ рд╕рд┐рдВрдереЗрдЯрд┐рдХ рдЧреНрд░рд╛рдлрд╝), TGTalker (ICL рд╡рд┐рдзрд┐)
  • рдЕрд╕реНрдерд╛рдпреА рддрд░реНрдХ: рдореМрдЬреВрджрд╛ рдмреЗрдВрдЪрдорд╛рд░реНрдХ рд╡рд╛рд╕реНрддрд╡рд┐рдХ рджреБрдирд┐рдпрд╛ рдХреЗ рдЬреНрдЮрд╛рди рдкрд░ рдирд┐рд░реНрднрд░ рдХрд░рддреЗ рд╣реИрдВ, рдпрд╣ рдкреЗрдкрд░ рдбреЗрдЯрд╛ рд░рд┐рд╕рд╛рд╡ рд╕реЗ рдмрдЪрдиреЗ рдХреЗ рд▓рд┐рдП рдЕрдирд╛рдорд┐рдд рдЧреНрд░рд╛рдлрд╝ рдХрд╛ рдЙрдкрдпреЛрдЧ рдХрд░рддрд╛ рд╣реИ

рдирд┐рд╖реНрдХрд░реНрд╖ рдФрд░ рдЪрд░реНрдЪрд╛

рдореБрдЦреНрдп рдирд┐рд╖реНрдХрд░реНрд╖

  1. ReaL-TG рд╡рд╛рд╕реНрддрд╡рд┐рдХ рджреБрдирд┐рдпрд╛ рдХреЗ рдЕрд╕реНрдерд╛рдпреА рдЧреНрд░рд╛рдлрд╝ рдкрд░ LLM рдХреЗ рд╡реНрдпрд╛рдЦреНрдпрд╛рдпреЛрдЧреНрдп рд▓рд┐рдВрдХ рдкреВрд░реНрд╡рд╛рдиреБрдорд╛рди рдХреЛ рд╕рдлрд▓рддрд╛рдкреВрд░реНрд╡рдХ рд▓рд╛рдЧреВ рдХрд░рддрд╛ рд╣реИ
  2. рдкрд░рд┐рдгрд╛рдо-рдЖрдзрд╛рд░рд┐рдд рд╕реБрджреГрдврд╝ рдЕрдзрд┐рдЧрдо LLM рдХреЛ рд╕реНрд╡рд╛рдпрддреНрдд рд░реВрдк рд╕реЗ рддрд░реНрдХ рд░рдгрдиреАрддрд┐рдпреЛрдВ рдХреА рдЦреЛрдЬ рдХрд░рдиреЗ рдХреЗ рд▓рд┐рдП рдкреНрд░рднрд╛рд╡реА рд░реВрдк рд╕реЗ рдирд┐рд░реНрджреЗрд╢рд┐рдд рдХрд░ рд╕рдХрддрд╛ рд╣реИ
  3. рдкреНрд░рд╕реНрддрд╛рд╡рд┐рдд рдореВрд▓реНрдпрд╛рдВрдХрди рдкреНрд░реЛрдЯреЛрдХреЙрд▓ LLM рдЧреНрд░рд╛рдлрд╝ рддрд░реНрдХ рдХреЗ рд▓рд┐рдП рд╡реНрдпрд╛рдкрдХ рдЧреБрдгрд╡рддреНрддрд╛ рдореВрд▓реНрдпрд╛рдВрдХрди рдврд╛рдВрдЪрд╛ рдкреНрд░рджрд╛рди рдХрд░рддрд╛ рд╣реИ

рд╕реАрдорд╛рдПрдВ

  1. рд╕рдВрджрд░реНрдн рд╡рд┐рдВрдбреЛ рд╕реАрдорд╛: рдкреВрд░реЗ рдмрдбрд╝реЗ рдкреИрдорд╛рдиреЗ рдХреЗ рдЕрд╕реНрдерд╛рдпреА рдЧреНрд░рд╛рдлрд╝ рдХреЛ рд╕рдВрднрд╛рд▓ рдирд╣реАрдВ рд╕рдХрддрд╛
  2. T-CGS рдкрд░ рдирд┐рд░реНрднрд░рддрд╛: рдпрджрд┐ рдорд╣рддреНрд╡рдкреВрд░реНрдг рдкреВрд░реНрд╡рд╛рдиреБрдорд╛рди рд╕рдВрдХреЗрдд k-hop рдкрдбрд╝реЛрд╕ рдХреЗ рдмрд╛рд╣рд░ рд╣реЛ рддреЛ рд╡рд┐рдлрд▓ рд╣реЛ рд╕рдХрддрд╛ рд╣реИ
  3. рдЖрдзрд╛рд░ рдореЙрдбрд▓ рдЖрд╡рд╢реНрдпрдХрддрд╛: рдкреБрд░рд╕реНрдХрд╛рд░ рдзреЛрдЦрд╛рдзрдбрд╝реА рд╕реЗ рдмрдЪрдиреЗ рдХреЗ рд▓рд┐рдП рдкрд░реНрдпрд╛рдкреНрдд рдмрдбрд╝реЗ рдЖрдзрд╛рд░ рдореЙрдбрд▓ рдХреА рдЖрд╡рд╢реНрдпрдХрддрд╛ рд╣реИ

рднрд╡рд┐рд╖реНрдп рдХреА рджрд┐рд╢рд╛рдПрдВ

  1. рдмрдбрд╝реЗ рдЖрдзрд╛рд░ рдореЙрдбрд▓ рдкрд░ рд▓рд╛рдЧреВ рдХрд░рдирд╛
  2. рдЧреНрд░рд╛рдлрд╝ рд╕рдВрджрд░реНрдн рдЗрдВрдЬреЗрдХреНрд╢рди рд╡рд┐рдзрд┐ рдХреЛ рдЕрдиреБрдХреВрд▓рд┐рдд рдХрд░рдирд╛
  3. рдЕрдиреНрдп рдЧреНрд░рд╛рдлрд╝ рддрд░реНрдХ рдХрд╛рд░реНрдпреЛрдВ рддрдХ рд╡рд┐рд╕реНрддрд╛рд░ рдХрд░рдирд╛

рдЧрд╣рди рдореВрд▓реНрдпрд╛рдВрдХрди

рд╢рдХреНрддрд┐рдпрд╛рдБ

  1. рдордЬрдмреВрдд рдирд╡рд╛рдЪрд╛рд░: рдкрд╣рд▓реА рдмрд╛рд░ RL рдХреЛ LLM рдЕрд╕реНрдерд╛рдпреА рдЧреНрд░рд╛рдлрд╝ рддрд░реНрдХ рдкрд░ рд▓рд╛рдЧреВ рдХрд░рдирд╛, рд╡реНрдпрд╛рдЦреНрдпрд╛рдпреЛрдЧреНрдпрддрд╛ рдФрд░ рд╕рд╛рдорд╛рдиреНрдпреАрдХрд░рдг рд╕рдорд╕реНрдпрд╛рдУрдВ рдХреЛ рд╣рд▓ рдХрд░рдирд╛
  2. рдкреВрд░реНрдг рд╡рд┐рдзрд┐: рдХрд╛рд░реНрдп рдкрд░рд┐рднрд╛рд╖рд╛, рдореЙрдбрд▓ рдбрд┐рдЬрд╛рдЗрди рд╕реЗ рдореВрд▓реНрдпрд╛рдВрдХрди рдкреНрд░реЛрдЯреЛрдХреЙрд▓ рддрдХ рдкреВрд░реНрдг рдкреНрд░рдгрд╛рд▓реА рдмрдирд╛рддрд╛ рд╣реИ
  3. рдкрд░реНрдпрд╛рдкреНрдд рдкреНрд░рдпреЛрдЧ: рдХрдИ рдбреЗрдЯрд╛рд╕реЗрдЯ, рдХрдИ рдореЗрдЯреНрд░рд┐рдХреНрд╕, рдорд╛рдирд╡ рд╕рддреНрдпрд╛рдкрди рдЖрджрд┐ рд╢рд╛рдорд┐рд▓
  4. рдЙрдЪреНрдЪ рд╡реНрдпрд╛рд╡рд╣рд╛рд░рд┐рдХ рдореВрд▓реНрдп: QA рдкреНрд░рддрд┐рдорд╛рди рдХрдореНрдкреНрдпреВрдЯреЗрд╢рдирд▓ рд▓рд╛рдЧрдд рдХреЛ рдХрдо рдХрд░рддрд╛ рд╣реИ, рд╡рд╛рд╕реНрддрд╡рд┐рдХ рдкрд░рд┐рджреГрд╢реНрдпреЛрдВ рдореЗрдВ рд╕реАрдзреЗ рд▓рд╛рдЧреВ рдХрд┐рдпрд╛ рдЬрд╛ рд╕рдХрддрд╛ рд╣реИ

рдХрдорд┐рдпрд╛рдБ

  1. рд╡рд┐рд╕реНрддрд╛рд░рд╢реАрд▓рддрд╛ рд╕реАрдорд╛: LLM рд╕рдВрджрд░реНрдн рд╡рд┐рдВрдбреЛ рд╕реАрдорд╛ рд╕реЗ рдкреНрд░рднрд╛рд╡рд┐рдд, рдЕрддрд┐-рдмрдбрд╝реЗ рдкреИрдорд╛рдиреЗ рдХреЗ рдЧреНрд░рд╛рдлрд╝ рдХреЛ рд╕рдВрднрд╛рд▓рдирд╛ рдХрдард┐рди
  2. рд╡рд┐рдзрд┐ рдЬрдЯрд┐рд▓рддрд╛: T-CGS рдПрд▓реНрдЧреЛрд░рд┐рдереНрдо рдореЗрдВ рдХрдИ рдкреИрд░рд╛рдореАрдЯрд░ рд╣реИрдВ, рд╕рд╛рд╡рдзрд╛рдиреАрдкреВрд░реНрд╡рдХ рдЯреНрдпреВрдирд┐рдВрдЧ рдХреА рдЖрд╡рд╢реНрдпрдХрддрд╛ рд╣реИ
  3. рдореВрд▓реНрдпрд╛рдВрдХрди рдкреВрд░реНрд╡рд╛рдЧреНрд░рд╣: LLM-as-a-Judge рдореЙрдбрд▓ рдкрд░рд┐рд╡рд╛рд░ рдкреВрд░реНрд╡рд╛рдЧреНрд░рд╣ рд╕реЗ рдЧреНрд░рд╕реНрдд рд╣реЛ рд╕рдХрддрд╛ рд╣реИ

рдкреНрд░рднрд╛рд╡

  1. рд╢реИрдХреНрд╖рдгрд┐рдХ рдореВрд▓реНрдп: LLM рдЧреНрд░рд╛рдлрд╝ рддрд░реНрдХ рдФрд░ рд╡реНрдпрд╛рдЦреНрдпрд╛рдпреЛрдЧреНрдп AI рдХреЗ рд▓рд┐рдП рдирдИ рд╕реЛрдЪ рдкреНрд░рджрд╛рди рдХрд░рддрд╛ рд╣реИ
  2. рд╡реНрдпрд╛рд╡рд╣рд╛рд░рд┐рдХ рдореВрд▓реНрдп: рдЕрдиреБрд╢рдВрд╕рд╛ рдкреНрд░рдгрд╛рд▓реА, рд╕рд╛рдорд╛рдЬрд┐рдХ рдиреЗрдЯрд╡рд░реНрдХ рд╡рд┐рд╢реНрд▓реЗрд╖рдг рдЖрджрд┐ рдореЗрдВ рд▓рд╛рдЧреВ рдХрд┐рдпрд╛ рдЬрд╛ рд╕рдХрддрд╛ рд╣реИ
  3. рдкрджреНрдзрддрд┐ рдпреЛрдЧрджрд╛рди: рдкреНрд░рд╕реНрддрд╛рд╡рд┐рдд рдореВрд▓реНрдпрд╛рдВрдХрди рдкреНрд░реЛрдЯреЛрдХреЙрд▓ рдЕрдиреНрдп LLM рддрд░реНрдХ рдХрд╛рд░реНрдпреЛрдВ рддрдХ рд╡рд┐рд╕реНрддрд╛рд░рд┐рдд рдХрд┐рдпрд╛ рдЬрд╛ рд╕рдХрддрд╛ рд╣реИ

рд▓рд╛рдЧреВ рдкрд░рд┐рджреГрд╢реНрдп

  • рд╡реНрдпрд╛рдЦреНрдпрд╛рдпреЛрдЧреНрдп рдкреВрд░реНрд╡рд╛рдиреБрдорд╛рди рдХреА рдЖрд╡рд╢реНрдпрдХрддрд╛ рд╡рд╛рд▓реЗ рдЕрд╕реНрдерд╛рдпреА рдЧреНрд░рд╛рдлрд╝ рдЕрдиреБрдкреНрд░рдпреЛрдЧ
  • рд╕реАрдорд┐рдд рдХрдореНрдкреНрдпреВрдЯреЗрд╢рдирд▓ рд╕рдВрд╕рд╛рдзрди рд▓реЗрдХрд┐рди рдЙрдЪреНрдЪ рдЧреБрдгрд╡рддреНрддрд╛ рддрд░реНрдХ рдХреА рдЖрд╡рд╢реНрдпрдХрддрд╛ рд╡рд╛рд▓реЗ рдкрд░рд┐рджреГрд╢реНрдп
  • рдирдП рдЧреНрд░рд╛рдлрд╝ рдХреЗ рд▓рд┐рдП рддреЗрдЬреА рд╕реЗ рдЕрдиреБрдХреВрд▓рди рдХреА рдЖрд╡рд╢реНрдпрдХрддрд╛ рдЬрд╣рд╛рдБ рдкреБрдирдГ рдкреНрд░рд╢рд┐рдХреНрд╖рдг рд╕рдВрднрд╡ рдирд╣реАрдВ рд╣реИ

рд╕рдВрджрд░реНрдн

рдореБрдЦреНрдп рд╕рдВрджрд░реНрдн рд╕рд╛рд╣рд┐рддреНрдп рдореЗрдВ рд╢рд╛рдорд┐рд▓ рд╣реИрдВ:

  • Huang et al. (2023): Temporal Graph Benchmark
  • Rossi et al. (2020): Temporal Graph Networks
  • Shao et al. (2024): GRPO рдЕрдиреБрдХреВрд▓рди рд╡рд┐рдзрд┐
  • Zheng et al. (2023): LLM-as-a-Judge рдореВрд▓реНрдпрд╛рдВрдХрди рдкреНрд░рддрд┐рдорд╛рди

рд╕рд╛рд░рд╛рдВрд╢: рдпрд╣ рдкреЗрдкрд░ рдПрдХ рдирд╡рд╛рдЪрд╛рд░реА рдврд╛рдВрдЪрд╛ рдкреНрд░рд╕реНрддрд╛рд╡рд┐рдд рдХрд░рддрд╛ рд╣реИ рдЬреЛ рдмрдбрд╝реЗ рднрд╛рд╖рд╛ рдореЙрдбрд▓ рдХреА рддрд░реНрдХ рдХреНрд╖рдорддрд╛ рдФрд░ рд╕реБрджреГрдврд╝ рдЕрдзрд┐рдЧрдо рдХреА рд╕реНрд╡-рдЕрдиреНрд╡реЗрд╖рдг рддрдВрддреНрд░ рдХреЛ рд╕рдлрд▓рддрд╛рдкреВрд░реНрд╡рдХ рд╕рдВрдпреЛрдЬрд┐рдд рдХрд░рддрд╛ рд╣реИ, рдЕрд╕реНрдерд╛рдпреА рдЧреНрд░рд╛рдлрд╝ рд▓рд┐рдВрдХ рдкреВрд░реНрд╡рд╛рдиреБрдорд╛рди рдХрд╛рд░реНрдп рдкрд░ рдорд╣рддреНрд╡рдкреВрд░реНрдг рдкреНрд░рдЧрддрд┐ рдкреНрд░рд╛рдкреНрдд рдХрд░рддрд╛ рд╣реИред рд╣рд╛рд▓рд╛рдВрдХрд┐ рдХреБрдЫ рд╕реАрдорд╛рдПрдВ рд╣реИрдВ, рд▓реЗрдХрд┐рди рд╡реНрдпрд╛рдЦреНрдпрд╛рдпреЛрдЧреНрдпрддрд╛ рдФрд░ рд╕рд╛рдорд╛рдиреНрдпреАрдХрд░рдг рдХреНрд╖рдорддрд╛ рдореЗрдВ рдЗрд╕рдХрд╛ рдпреЛрдЧрджрд╛рди рдЗрд╕ рдХреНрд╖реЗрддреНрд░ рдХреЗ рд╡рд┐рдХрд╛рд╕ рдХреЗ рд▓рд┐рдП рдирдИ рджрд┐рд╢рд╛ рдЦреЛрд▓рддрд╛ рд╣реИред