Knowledge graphs (KGs), with their structured representation capabilities, offer promising avenue for enhancing Retrieval Augmented Generation (RAG) systems, leading to the development of KG-RAG systems. Nevertheless, existing methods often struggle to achieve effective synergy between system effectiveness and cost efficiency, leading to neither unsatisfying performance nor excessive LLM prompt tokens and inference time. To this end, this paper proposes REMINDRAG, which employs an LLM-guided graph traversal featuring node exploration, node exploitation, and, most notably, memory replay, to improve both system effectiveness and cost efficiency. Specifically, REMINDRAG memorizes traversal experience within KG edge embeddings, mirroring the way LLMs "memorize" world knowledge within their parameters, but in a train-free manner. We theoretically and experimentally confirm the effectiveness of REMINDRAG, demonstrating its superiority over existing baselines across various benchmark datasets and LLM backbones. Our code is available at https://github.com/kilgrims/ReMindRAG.
academic 論文ID : 2510.13193タイトル : ReMindRAG: Low-Cost LLM-Guided Knowledge Graph Traversal for Efficient RAG著者 : Yikuan Hu, Jifeng Zhu, Lanrui Tang, Chen Huang分類 : cs.IR (情報検索)発表会議 : 第39回ニューラル情報処理システム会議 (NeurIPS 2025)論文リンク : https://arxiv.org/abs/2510.13193 コードリンク : https://github.com/kilgrims/ReMindRAG 知識グラフ(KG)はその構造化表現能力により、検索拡張生成(RAG)システムを強化するための有望な手段を提供し、KG-RAGシステムの発展を促進しています。しかし、既存の方法は、システムの有効性とコスト効率の間で効果的な協調を実現することが難しく、性能不足またはLLMプロンプトトークンと推論時間の過剰消費につながっています。これに対応するため、本論文ではREMINDRAGを提案します。これはLLMガイド知識グラフ走査を採用し、ノード探索、ノード活用、および最も重要なメモリ再生メカニズムを含み、システムの有効性とコスト効率を向上させます。具体的には、REMINDRAGはKGエッジ埋め込みに走査経験を記憶し、LLMがそのパラメータに世界知識を「記憶」するのと同様ですが、訓練不要な方式を採用しています。REMINDRAGの有効性を理論と実験の両面から確認し、様々なベンチマークデータセットとLLMバックボーン上で既存のベースラインを上回ることを証明しています。
従来のRAG方法は主に密集ベクトル検索に依存して関連テキストセグメントを識別していますが、複数ホップ推論や長距離依存関係を捉える必要がある複雑なタスクでは限定的な性能しか発揮できません。知識グラフはその構造化されたエンティティと関係表現により、この問題を解決するための新しい道を提供します。
従来のグラフ検索アルゴリズム : PageRankおよびGNN方法など、グラフ内の細かい意味関係を捉えることが難しく、システムの有効性が不足していますLLMガイド知識グラフ走査方法 : 優れた性能を示していますが、大量のLLM呼び出しが必要であり、コストと推論時間が大幅に増加します効率と効果のトレードオフ : 既存のKG-RAGシステムは、システムの有効性とコスト効率の間で効果的なバランスを見つけることが難しいです本論文は、KG-RAGシステムにおけるシステム有効性とコスト効率の協調最適化問題を解決することを目的としており、これは実際の展開とスケーラビリティの主要な課題です。
主要課題の特定 : KG-RAGシステムにおけるシステム有効性とコスト効率の協調最適化の課題を明確に指摘REMINDRAGフレームワークの提案 : LLMガイド知識グラフ走査を採用し、ノード探索、ノード活用、メモリ再生メカニズムを含む理論分析 : グラフ走査メモリ再生の有効性を理論的に証明実験検証 : 複数のベンチマークデータセットとLLMバックボーン上でREMINDRAGの優越性を検証非構造化テキスト文書とユーザークエリが与えられた場合、目標は知識グラフを構築し、効率的なグラフ走査メカニズムを通じて関連情報を検索し、正確な回答を生成することであり、同時にLLM呼び出しコストを最小化します。
REMINDRAGは異種知識グラフを構築し、以下を含みます:
エンティティノード : テキストから抽出された固有表現アンカーノード : テキストブロックタイトルを保存テキストブロック集合 : 分割された元の文書関係接続 : エンティティ-関係-エンティティ三つ組とコンテキストスケルトンネットワークノード探索戦略 :
回答に導く可能性のあるノードを優先的に探索 各反復で、LLMは部分グラフS内のすべてのノードを評価し、回答に導く可能性が最も高いターゲットノードaを選択 ノード活用戦略 :
以前に探索されたノードの活用に焦点を当て、これらのノードに沿ってパスを拡張 選択されたノードaが与えられた場合、LLMはその隣接ノード集合Saから最適な拡張ノードpを選択 メモリ内容 :
有効パス: 正しい回答に導くパス(正の強化) 無効パス: 回答に導かないパス(負の強化) メモリ方法 :
閉形式方程式を使用してエッジ埋め込みを更新:
重み関数: δ(x) = (2/π)cos(π||x||₂/2)
有効パスの強化: v̂ = v + δ(v) · q/||q||₂
無効パスの罰則: v̂ = v - δ(v·q/||q||₂) · v·q/||q||₂
高速唤起と減衰更新 :
高速唤起: エッジ埋め込みvのノルムが小さい場合、δ関数は大きな方向更新を生成 減衰更新: エッジ埋め込みvのノルムが大きい場合、δ関数は小さな更新のみを生成し、安定性を保持 訓練不要なメモリメカニズム : エッジ埋め込みを通じて走査経験を記憶し、追加の訓練が不要探索と活用のバランス : ノード探索と活用戦略を組み合わせ、グローバルとローカルの最適検索を実現適応的重み更新 : ベクトルノルムに基づく適応的更新戦略により、高速学習と長期安定性の両立長依存QA : LooGLEデータセット、長距離意味検索能力をテスト複数ホップQA : HotpotQAデータセット、複数ステップ推論能力を評価シンプルQA : LooGLE短依存QA、直接関連情報抽出能力をテスト有効性評価 : GPT-4oをLLM判定器として使用し、回答の正確性を評価コスト効率評価 : 走査プロセス中の各クエリあたりの平均LLMトークン消費従来の検索方法 : BM25、NaiveRAGグラフ検索アルゴリズムを使用するKG-RAGシステム : GraphRAG、LightRAG、HippoRAG2LLMガイドKG-RAGシステム : Plan-on-GraphLLMバックボーン : GPT-4o-mini、Deepseek-V3埋め込みモデル : nomic-ai/nomic-embed-text-v2-moeテキスト分割 : 750トークン長主要パラメータ : α=0.1(ノード関連性重み)、λ=0.55(強接続閾値)QAタイプ GPT-4o-mini Deepseek-V3 長依存QA 57.04% 59.73% 複数ホップQA 74.22% 79.38% シンプルQA 76.67% 77.01%
REMINDRAGはすべてのタスクでベースラインを大幅に上回ります:
長依存QA: 平均12.08%向上 複数ホップQA: 平均10.31%向上 シンプルQA: 平均4.66%向上 設定タイプ 正確率 トークン消費 コスト削減 メモリなし 57.04% 14.91K - 1ラウンドメモリ 56.48% 9.68K 35.1% 2ラウンドメモリ 58.01% 7.55K 49.4% 3ラウンドメモリ 60.31% 6.71K 55.0%
複数ラウンドのメモリ後、REMINDRAGは平均58.8%のトークン消費削減を実現します。
コンテキストスケルトンネットワークの影響 :
コンテキストスケルトンネットワークを削除すると、長依存QAの性能は57.04%から51.01%に低下 コンテキスト情報キャプチャの重要性を検証 ホップ数設定の影響 :
最大ホップ数が増加するにつれ、システム性能は単調に増加 より多くのホップにより、ノードはより広い隣域情報にアクセス可能 自己修正能力 :
初回エラー回答後、システムはメモリルールに基づいて無関係なノードを罰則 後続クエリでメモリ最適化部分グラフに切り替え、エラー自己修正を実現 メモリ安定性 :
複雑な複数ラウンドメモリ設定下で安定した性能を維持 異種データセット処理時にロバスト性を示す 一定の意味的類似性を持つクエリ集合に対して、埋め込み次元dが十分に大きい場合、エッジ埋め込みは効果的にクエリ情報を記憶できます。条件は:
θ ≤ lim[d→∞] [2 arcsin(√(1/2 sin(arccos(λ))))]
ここでθはクエリ埋め込み対間の最大角度、λは強接続閾値です。
λの理論上限は0.775で、既存の意味的類似性閾値0.6の研究と一致 埋め込み次元が100を超える場合、理論近似は実践で顕著な実用性を持つ 従来のグラフ検索方法 : PageRank、ランダムウォーク、GNNなど、細かい意味関係を捉えることが難しいLLMガイド方法 : LLMの意味理解能力を活用しますが、コストが高いグラフ剪定とパス計画 : 既存の最適化方法の効果は限定的強化学習のメモリ再生概念から着想を得た メモリを明示的なサンプル再生ではなく、グラフの重みとして埋め込むことで革新的 REMINDRAGはシステム有効性とコスト効率の協調最適化に成功 メモリ再生メカニズムは後続クエリの効率を大幅に向上 自己修正能力はシステムのロバスト性を強化 初期グラフ走査コスト : 初回走査には依然として複数のLLM呼び出しが必要大規模文書処理 : 知識グラフ構築には大量の時間と計算リソースが必要メモリ容量制限 : 理論分析は無限次元の仮定に基づいており、実際の応用では制限される可能性事前訓練メモリ初期化 : 領域特定のFAQを使用してモデルメモリを事前初期化分散グラフ構築 : 大規模文書のグラフ構築効率を最適化動的メモリ管理 : 長期メモリの忘却と更新メカニズムを研究革新性が強い : 訓練不要なグラフ走査メモリメカニズムを初めて提案理論が堅実 : メモリ容量の理論分析と保証を提供実験が充分 : 複数データセット、複数バックボーンの包括的評価実用価値が高い : 顕著な性能向上とコスト削減パラメータ感度 : 複数のハイパーパラメータ設定が性能に影響する可能性スケーラビリティ問題 : 超大規模知識グラフへの適用性が十分に検証されていないメモリ更新戦略 : 単純な線形更新はすべてのシナリオに適さない可能性学術的貢献 : KG-RAG分野に新しい最適化思想を提供実際の応用 : 質問応答システム、情報検索など広範な応用前景再現性 : オープンソースコードを提供し、研究コミュニティの検証と拡張を容易に複数ラウンド対話システム : 履歴交互作用を記憶し、応答効率を向上領域特定質問応答 : 特定領域内で走査経験を蓄積・活用可能コスト敏感なアプリケーション : LLM呼び出しコストに厳格な要件があるシーン本論文はRAG、知識グラフ、グラフニューラルネットワークなど複数分野の重要な研究を引用しており、以下を含みます:
Lewis et al. (2020): 知識集約的NLPタスクのための検索拡張生成 Edge et al. (2024): クエリ焦点要約へのGraphRAGアプローチ Guo et al. (2024): LightRAG シンプルで高速な検索拡張生成 その他55篇の関連文献 総合評価 : REMINDRAGは高品質の研究成果であり、KG-RAG分野で革新的なソリューションを提案しています。この方法は技術的なブレークスルーを実現するだけでなく、実際の応用における主要な問題——効果と効率のバランス——を解決しています。理論分析は厳密で、実験設計は合理的で、結果は説得力があります。いくつかの制限事項がありますが、その貢献は顕著であり、KG-RAG技術の実用化推進に重要な意義を持ちます。