Multi-agent systems powered by large language models exhibit strong capabilities in collaborative problem-solving. However, these systems suffer from substantial knowledge redundancy. Agents duplicate efforts in retrieval and reasoning processes. This inefficiency stems from a deeper issue: current architectures lack mechanisms to ensure agents share minimal sufficient information at each operational stage. Empirical analysis reveals an average knowledge duplication rate of 47.3\% across agent communications. We propose D3MAS (Decompose, Deduce, and Distribute), a hierarchical coordination framework addressing redundancy through structural design rather than explicit optimization. The framework organizes collaboration across three coordinated layers. Task decomposition filters irrelevant sub-problems early. Collaborative reasoning captures complementary inference paths across agents. Distributed memory provides access to non-redundant knowledge. These layers coordinate through structured message passing in a unified heterogeneous graph. This cross-layer alignment ensures information remains aligned with actual task needs. Experiments on four challenging datasets show that D3MAS consistently improves reasoning accuracy by 8.7\% to 15.6\% and reduces knowledge redundancy by 46\% on average.
論文ID : 2510.10585タイトル : D3MAS: Decompose, Deduce, and Distribute for Enhanced Knowledge Sharing in Multi-Agent Systems著者 : Heng Zhang, Yuling Shi, Xiaodong Gu, Haochen You, Zijian Zhang, Lubin Gan, Yilei Yuan, Jin Huang分類 : cs.GR(グラフィックス)発表日 : 2025年10月12日論文リンク : https://arxiv.org/abs/2510.10585v1 大規模言語モデルに基づくマルチエージェントシステムは協調的な問題解決において強力な能力を示していますが、これらのシステムには深刻な知識冗長性の問題が存在します。エージェントは検索および推論プロセスにおいて重複した作業を行い、平均知識重複率は47.3%に達しています。この非効率性は、より根本的な問題に由来しています。すなわち、現在のアーキテクチャは、各操作段階においてエージェント間で最小限必要な情報を共有することを保証するメカニズムが欠けています。本論文はD3MAS(分解、推論、分配)フレームワークを提案し、明示的な最適化ではなく構造化設計を通じて冗長性の問題に対処します。このフレームワークは3つの協調層で協力を組織しています。タスク分解層は無関連な部分問題をフィルタリングし、協調推論層はエージェント間の相補的な推論経路を捉え、分散メモリ層は非冗長な知識アクセスを提供します。これらの層は異種グラフ内の構造化メッセージパッシングを通じて調整され、情報が実際のタスク要件と一致していることを保証します。4つの挑戦的なデータセットでの実験により、D3MASは推論精度を8.7%~15.6%向上させ、平均46%の知識冗長性を削減することが示されました。
本研究が解決する中核的な問題は、マルチエージェントシステムにおける知識冗長性 の問題です。具体的には以下のように表現されます:
検索冗長性 :複数のエージェントが独立して同一または重複した知識を検索する推論冗長性 :エージェントが意味的に類似した推論経路を追求するタスク冗長性 :部分タスク割り当てにおける重複の問題知識冗長性の問題はマルチエージェントシステムの効率性と性能に深刻な影響を与えます:
実証分析によると、エージェント通信における平均知識重複率は47.3%です 計算リソースの浪費と協調効果の低下をもたらします 複雑なタスクにおけるマルチエージェントシステムの効果的な応用を阻害します 既存のマルチエージェント協調手法には以下の問題があります:
アーキテクチャの断片化 :タスク調整、推論実行、メモリ検索が独立したコンポーネントとして扱われている層間同期の欠如 :各層の決定が他の層のコンテキスト情報を欠いている情報フロー最適化の不足 :情報を体系的にフィルタリングおよび整列させることができない情報理論の観点から、効果的な協力には、エージェント間で交換される情報が各操作段階において最小限にして十分 であることを保証する必要があります。本論文は、情報理論目標を明示的に計算するのではなく、構造化設計を通じて情報最適化を暗黙的に実現することを提案しています。
重要な問題の特定 :マルチエージェントシステムにおける層間調整の欠如の問題を初めて体系的に分析し、47.3%の知識重複率を発見しましたD3MASフレームワークの提案 :異種グラフアーキテクチャに基づく統一されたマルチエージェント協調フレームワークであり、明示的な依存関係モデリングを通じて冗長性を大幅に削減します性能向上の実現 :複数の挑戦的なベンチマークテストで8.7%~15.6%の精度向上を実現し、同時に平均46%の知識冗長性を削減しましたマルチエージェント推論システムはS = {A₁, A₂, ..., Aₙ}として定義されます。ここで各エージェントAᵢは独立した推論プロセスと知識ベースKᵢを持ちます。複雑なクエリqが与えられた場合、システムは協調推論を通じて統合された回答aを生成します。
D3MASはマルチエージェント協力を組織するための統一異種グラフG_D3MASを構築し、3つのノードタイプを含みます:
ノードタイプセット :
T_v = {T_task, T_reason, T_memory} エッジタイプセット :
T_e = {e_decompose, e_trigger, e_depend, e_retrieve, e_ground, e_relate} タスクグラフG⁽⁰⁾ = (V⁽⁰⁾, E⁽⁰⁾)を構築します。ノードは元のクエリqから派生した部分問題を表します。
分解プロセス :
V⁽⁰⁾ = {v_root} ∪ ⋃ⱼ₌₁ᵐ {vⱼ⁽⁰⁾ | vⱼ⁽⁰⁾ = Create(tⱼ), tⱼ ∈ LLM_decomp(v_parent)}
タスク割り当て :
Assign(vⱼ⁽⁰⁾) = arg max_{Aᵢ∈S} Capability(Aᵢ, vⱼ⁽⁰⁾)
推論グラフG⁽¹⁾ = (V⁽¹⁾, E⁽¹⁾)を維持します。ノードは異なるエージェントの推論ステップを表します。
推論ノード生成 :
vᵢ,ₖ⁽¹⁾ = LLM_Aᵢ(Concat(c_{vₖ⁽⁰⁾}, C_Aᵢ))
依存エッジ構築 :
E_depend = {(vᵢ,ₖ⁽¹⁾, vⱼ,ₗ⁽¹⁾) | Premise(vᵢ,ₖ⁽¹⁾) ∩ Conclusion(vⱼ,ₗ⁽¹⁾) ≠ ∅}
知識グラフG⁽²⁾ = (V⁽²⁾, E⁽²⁾)を組織します。ノードはエンティティと概念を表します。
関連性スコアリング :
Score(vₗ⁽²⁾, q_mem) = (h_{vₗ} · f_embed(q_mem)) / (‖h_{vₗ}‖ · ‖f_embed(q_mem)‖)
分散検索 :
M_retrieve = Top-k(⋃ᵢ₌₁ⁿ {v ∈ Gᵢ⁽²⁾ | Score(v, q_mem) > θ})
層間の情報フローはタイプ認識メッセージパッシングを通じて実現されます:
h_v⁽ᵗ⁺¹⁾ = UPDATE(φ(v))(h_v⁽ᵗ⁾, ⊕_{u∈N(v)} MSG(ψ(u,v))(h_u⁽ᵗ⁾))
メッセージパッシングは自下向上および自上向下の段階を交互に行い、継続的な整列を実現します。
構造化冗長性削減 :異種グラフを通じた依存関係の明示的モデリングにより、重複作業を回避します層間調整メカニズム :3層間の双方向情報フローにより、決定がグローバルコンテキストに基づいていることを保証します最小限にして十分な情報共有 :構造化設計を通じた情報理論最適化の暗黙的実現4つの多様な公開ベンチマークテストを使用します:
MMLU :57の学科における多肢選択問題。論理推論と世界知識をテストしますHumanEval :164の手作成プログラミング問題。コード生成能力をテストしますCommonGen :制約付きテキスト生成。常識推論を評価しますARC-Challenge :小学校の科学問題。高度な推論が必要です精度 :すべてのベンチマークテストの主要指標MAgIC次元 :Judge、Reason、Decept、Self-Aware、Compre、Coord、Rationalの7つの次元冗長率 :メモリ冗長性、推論冗長性、タスク冗長性の統合測定単一エージェント手法(CoT、CoT-SC、Reflexionなど)とマルチエージェント手法(AutoGen、MetaGPT、MACNETなど)を含みます。
言語生成器としてGPT-4を使用 テキスト埋め込みの計算にBGE-M3を使用 埋め込み次元d=512、メッセージパッシング層数L=3 検索閾値θ=0.65、top-k=5 D3MASはすべてのベンチマークテストにおいてベースライン手法を大幅に上回ります:
データセット D3MAS 最良ベースライン 改善幅 MMLU 85.3% 68.8% (MACNET) +16.5% HumanEval 89.8% 72.6% (AgentVerse) +17.2% SRDD 86.2% 80.5% (MACNET) +5.7% CommonGen 76.8% 68.9% (Reconcile) +7.9%
各コンポーネントの貢献度分析:
コンポーネント削除 MMLU精度低下 HumanEval精度低下 タスク層 -7.1% -8.3% 推論層 -12.7% -13.4% メモリ層 -8.5% -10.5% メッセージパッシング -15.9% -16.0% フラットアーキテクチャ -21.2% -21.1%
平均冗長性削減46% メモリ冗長性の削減が最も顕著 計算効率5~8倍向上 最適top-k値:5 最適類似性閾値:0.65 最適エージェント数:6 最適埋め込み次元:512 既存研究には相互作用駆動型手法、対話フレームワーク、役割割り当て戦略などが含まれていますが、一般的に効率の問題が存在します。
初期の研究ではグラフを暗黙的に使用し、最近の研究では明示的にグラフ構造を定義していますが、タスク認識のトポロジー設計が欠けています。
関連研究と比較して、D3MASは層間組織化とタスク認識の動的トポロジー調整能力を提供します。
D3MASは層間調整を通じてマルチエージェントシステムにおける知識冗長性の問題を効果的に解決します 構造化設計は明示的な最適化よりも最小限にして十分な情報共有の実現に適しています 層間整列はシステム全体の冗長性を削減するための重要な要素です 現在の実験は主にGPT-4に基づいており、他のモデルでの汎化性の検証が必要です 超大規模エージェント群への拡張戦略についてさらなる研究が必要です リアルタイム動的タスクへの適応性の向上が必要です 論文は大規模エージェント群への拡張戦略の探索を提案しており、これは重要な研究方向です。
問題定義の明確性 :マルチエージェントシステムにおける知識冗長性の問題を初めて体系的に定量化しました方法の革新性 :異種グラフアーキテクチャと層間調整メカニズムは独創的です実験の充実性 :複数データセット、複数ベースラインの包括的な比較により、結果の説得力があります理論基盤の堅実性 :情報理論に基づく理論分析は方法設計に堅実な基礎を提供します計算複雑性分析の欠如 :フレームワークの時間および空間複雑性の詳細な分析がありません実装可能性の検討不足 :実環境への導入の可行性分析が不足していますエラー伝播メカニズム :層間エラー伝播の影響と緩和戦略についての十分な検討がありません学術的貢献 :マルチエージェント協力分野に新しい研究パラダイムを提供します実用的価値 :コード生成、科学推論などの分野で広範な応用前景があります再現性 :詳細な実装詳細が提供されており、再現と拡張が容易ですD3MASは特に以下の場合に適しています:
複雑な推論が必要な多段階タスク 知識集約型の問題解決 協調的なコード開発とデバッグ 科学研究と分析タスク 論文は69の関連文献を引用しており、マルチエージェントシステム、グラフニューラルネットワーク、大規模言語モデルなど複数の分野の重要な研究をカバーしており、研究に堅実な理論基礎を提供しています。
総合評価 :これは高品質の研究論文であり、マルチエージェントシステム分野において革新的なソリューションを提案しています。論文は問題定義が明確で、方法設計が合理的で、実験検証が充分であり、重要な学術的価値と実用的意義を持っています。