With the rapid proliferation of large language models and vision-language models, AI agents have evolved from isolated, task-specific systems into autonomous, interactive entities capable of perceiving, reasoning, and acting without human intervention. As these agents proliferate across virtual and physical environments, from virtual assistants to embodied robots, the need for a unified, agent-centric infrastructure becomes paramount. In this survey, we introduce the Internet of Agents (IoA) as a foundational framework that enables seamless interconnection, dynamic discovery, and collaborative orchestration among heterogeneous agents at scale. We begin by presenting a general IoA architecture, highlighting its hierarchical organization, distinguishing features relative to the traditional Internet, and emerging applications. Next, we analyze the key operational enablers of IoA, including capability notification and discovery, adaptive communication protocols, dynamic task matching, consensus and conflict-resolution mechanisms, and incentive models. Finally, we identify open research directions toward building resilient and trustworthy IoA ecosystems.
academic- 論文ID: 2505.07176
- タイトル: Internet of Agents: Fundamentals, Applications, and Challenges
- 著者: Yuntao Wang, Shaolong Guo, Yanghe Pan, Zhou Su, Fahao Chen, Tom H. Luan, Peng Li, Jiawen Kang, Dusit Niyato
- 分類: cs.MA(マルチエージェントシステム)、cs.AI(人工知能)
- 発表時期: 2025年1月(IEEE TCCN採択:2025年10月)
- 論文リンク: https://arxiv.org/abs/2505.07176
大規模言語モデルと視覚言語モデルの急速な普及に伴い、AIエージェントは孤立した特定タスク向けシステムから、人間の介入なしに知覚、推論、行動が可能な自律的相互作用実体へと進化しました。仮想環境と物理環境に広く配置されるこれらのエージェント(仮想アシスタントから具体化ロボットまで)に対応するため、統一されたエージェント中心のインフラストラクチャの構築が極めて重要になっています。本総説では、エージェントのインターネット(IoA)を基盤フレームワークとして導入し、大規模異種エージェント間のシームレスな相互接続、動的発見、協調的オーケストレーションを実現します。本論文はまず、汎用IoAアーキテクチャを提案し、その階層的組織、従来のインターネットとの相違特性、および新興応用を強調しています。次に、IoAの主要な運用実現技術を分析します。これには、能力通知と発見、適応的通信プロトコル、動的タスクマッチング、合意形成と紛争解決メカニズム、および経済的インセンティブモデルが含まれます。最後に、弾力的で信頼できるIoAエコシステムの構築に向けた未解決の研究課題を特定します。
本研究が対処する中核的課題は、大規模異種AIエージェントの相互接続、協調、およびオーケストレーションをサポートするための統一インフラストラクチャをいかに構築するかです。具体的には以下を含みます:
- 相互接続性の課題:既存のマルチエージェントシステムは主に単一デバイス上でシミュレーション実行されていますが、実際のIoA展開には数十億の地理的に分散したエージェントが必要であり、各エージェントは独自の計算、ネットワーク、センシング、およびエネルギー構成を持ちます。
- エージェント固有のインターフェース:現在のコンピュータ使用エージェント(OpenAIのOperatorなど)は、ブラウザとアプリケーションを制御するために人間のGUI操作を模倣することに依存しており、高い画面キャプチャオーバーヘッドが発生します。
- 自律的協調:IoAは高度に動的な環境で動作する物理および仮想エージェントを含み、エージェントが自己組織化、自己交渉を行い、低コスト、高効率の協調ネットワークを形成する必要があります。
AIエージェントの急速な発展に伴い、Gartnerは2028年までに日常業務の少なくとも15%がAIエージェントにより自律的に実行され、企業アプリケーションの33%がエージェント駆動型インテリジェンスを統合すると予測しています。エージェントはデジタルおよび物理空間の「新しい市民」となり、経済構造と人間社会の相互作用を再構成しています。
既存研究は主にマルチエージェントシステム(MAS)に焦点を当てており、3つの主要な課題があります:
- エコシステムの孤立:既存フレームワークはエージェントを独自の環境に限定し、第三者エージェントの統合を制限しています
- 単一デバイスシミュレーション:ほとんどのMASは単一デバイスシミュレーションに限定されており、エージェントが複数デバイスおよび地理的位置にわたって実行される現実的シナリオと対照的です
- 硬直した通信と調整:既存のエージェントプロトコルと状態遷移は主にハードコード化されており、実際の協調の動的で特定タスク固有の性質を捉えることができません
- 汎用IoAアーキテクチャ:IoAアーキテクチャの全体的概要を提供し、その階層的フレームワーク、従来のインターネットとの相違特性、主要特性、および新興応用を概説しています
- IoA主要実現技術:IoAをサポートする主要実現技術を分析します。これには、能力通知と発見、動的タスクオーケストレーションとマッチング、適応的通信プロトコル、合意形成と紛争解決メカニズム、経済モデル、および規制モデルが含まれます
- 未解決課題の特定:IoA領域の未解決問題を特定し、その広範な採用と持続可能な発展を促進する将来の研究方向を指摘しています
IoAは4層アーキテクチャ設計を採用しています:
- インフラストラクチャ層:AIモデル、データ、知識、計算、通信などの主要リソースを統合します。基礎モデル(GPT-4o、DeepSeek-R1など)、マルチモーダルデータインフラストラクチャ、通信技術(5G URLLC、メッシュネットワークなど)を含みます
- エージェント管理層:IoA内のエージェントのアイデンティティ、能力、発見、およびライフサイクルを管理します。分散識別子(DID)、能力セマンティックモデリング、パブリッシュ-サブスクライブメカニズムをサポートします
- エージェント調整層:分散タスク実行とエージェント協調を管理します。タスク分解、プロセスオーケストレーション、適応的通信プロトコル、動的エージェント-タスクマッチングをサポートします
- アプリケーション層:標準化されたインターフェースとセマンティック整列を提供します。クロスモーダル、セマンティック、知識レベルの統合をサポートします
各IoAエージェントは4つの中核機能モジュールを含みます:
- 計画モジュール:大規模言語モデルベースの推論、タスク分解、意思決定を実施します。連鎖思考(CoT)、木構造思考(ToT)などの技術を含みます
- メモリモジュール:短期コンテキストと長期知識を維持します。継続的学習と個性化をサポートします
- 相互作用モジュール:人間、エージェント、環境インターフェース間の通信協調を実現します
- 行動モジュール:物理アクチュエータとソフトウェアツールインターフェースを通じて計画実行を実現します
- 能力評価:自己報告声明とシステム検証を組み合わせ、エージェント能力プロファイルを構築します
- 能力通知:プロアクティブ通知、イベントトリガー、周期的同期戦略を採用します
- 能力検索:従来の検索から、セマンティック検索、知識強化、エージェント強化検索へと発展します
- 相互作用パターン:集約、反思、議論、ツール使用など複数の協調モード
- 通信トポロジー:チェーン型、スター型、ツリー型、グラフ型などのネットワーク構造
- タスク分解:ルールベースおよび学習ベースの分解方法
- タスク割り当て:ルーティング割り当てと自己組織化割り当て戦略
5つの代表的プロトコルを比較しています:
- MCP(Model Context Protocol):Anthropicが提案したクライアント-サーバーアーキテクチャ
- A2A(Agent-to-Agent):Googleが提案したP2P相互作用プロトコル
- ANP(Agent Network Protocol):完全分散P2Pアーキテクチャ
- AGNTCY:標準化協調を促進するハイブリッドアーキテクチャ
- Agora:効率性、汎用性、移植性のバランスを取る研究プロジェクト
論文は複数の代表的なIoA実装を分析しています:
- ChenらによるIoAプロトタイプ:階層的クライアント-サーバーアーキテクチャを採用し、異種仮想エージェント協調をサポートします
- DAWNシステム:グローバル分散IoA協調をサポートする階層的アーキテクチャ
- シーメンス産業コパイロット:生産ライフサイクル全体に適用される自律エージェント
- 美的スマートファクトリー:38の生産シナリオにわたって14個のエージェントを展開
論文は5つの代表的応用シナリオを詳細に説明しています:
- スマートホーム:家庭エージェントサブネット内のP2P通信
- ヘルスケア:医療施設内のロボット調整
- スマートファクトリー:現場および外部エージェント調整
- スマートグリッド:IoAサブネットおよび外部エージェントを通じたエネルギー管理
- スマートシティ:クロスドメインエージェントネットワーク
論文はIoAの6つの主要特性を特定しています:
- 自律的インテリジェンス:エージェントは高度な自律性を持ち、能力を主動的に公開し、独立して協調を開始できます
- 高動的性:オンデマンドエージェント作成、マイグレーション、終了、およびリアルタイムワークフロー再構成をサポートします
- 高異種性:マイクロコントローラノードからGPUクラスタ駆動エージェントまでの広範なスペクトラムを網羅します
- 大規模スケーラビリティ:小規模一時的エージェントチームから数十億のクロスドメインエージェントへのスケーリングをサポートします
- セマンティック認識通信:大規模言語モデルベースのコンテキスト認識セマンティック理解と推論能力
- タスク駆動協調:タスク指向ネットワークを優先し、エージェントはタスク要件に合わせて能力を動的に調整します
論文はIoAと従来のインターネットおよびIoTの相違を体系的に比較しています:
| 次元 | 従来のインターネット | IoT | IoA |
|---|
| 中核目標 | ホストと情報接続 | デバイスと情報接続 | エージェントと知識接続 |
| アーキテクチャ | 中央集約型(クライアント-サーバー) | 分散型(エッジ-エッジ-クラウド) | ハイブリッド型(P2P+プロキシ) |
| 相互作用モード | パッシブ(リクエスト-レスポンス) | イベント駆動 | プロアクティブ(目標指向) |
| 通信レベル | ビットレベル転送 | ビットレベル+軽量プロトコル | セマンティックレベル交換 |
| 自律性の源 | 人間制御 | ルールベースデバイスロジック | 大規模言語モデル駆動エージェントインテリジェンス |
- IoA標準化と相互運用性フレームワーク:プラットフォーム間およびドメイン間の相互運用性を確保するための統一標準化フレームワークの開発
- 安全適応的エージェント通信プロトコル:汎用性-効率-移植性の三者択一を処理し、厳密なセキュリティ保証を組み込みます
- 分散自律エージェントエコシステム:中央権限を必要としない自律メカニズムの開発。生物学的エコシステムに類似しています
- エージェントベース経済システム:短期容量認識経済報酬と長期評判追跡を組み合わせた適応的インセンティブメカニズムの統合
- プライバシー保護エージェント相互作用:コンテキスト認識とタスク駆動プライバシー設計を統合し、エージェントがタスク重要性に基づいてプライバシー保護レベルを動的に交渉できるようにします
- サイバーフィジカルセキュリティIoA:電力網エージェント関連ネットワークトラフィックとフェーザ測定ユニット読み取り値を検出して虚偽データ注入を検出するなど、サイバーフィジカル防御の統合
- 倫理的相互運用IoA:倫理的コンプライアンスの確保には、透明な道徳推論と適応的セマンティック整列が必要です
IoAは自律相互接続インテリジェント システムの次世代インフラストラクチャを表し、異種エージェントの大規模協調のための包括的フレームワークを提供します。階層的アーキテクチャ、動的発見メカニズム、適応的通信プロトコル、経済的インセンティブモデルを通じて、IoAはスマートホームからスマートシティまでの広範な応用シナリオをサポートできます。
- スケーラビリティ課題:大規模IoAシステムにおけるリアルタイム調整と合意形成メカニズムは依然として遅延とスループット制限に直面しています
- セキュリティとプライバシー問題:クロスドメインエージェント協調は新しい攻撃面とプライバシー漏洩リスクをもたらします
- 標準化の不足:統一されたエージェント記述言語と軽量通信プロトコルが不足しています
- 経済モデルの複雑性:異種IoAプラットフォーム間で相互運用可能で公正な経済フレームワークの開発は依然として課題です
論文はIoAの成熟には、ネットワークアーキテクチャ、相互運用性標準、セキュリティパラダイムにおける継続的な革新が必要であることを指摘しており、特に大規模展開、クロスドメイン協調、倫理的コンプライアンスの処理に関してです。
- 包括性:IoA領域の初の体系的総説を提供し、アーキテクチャ設計、主要技術、応用シナリオ、将来方向を網羅しています
- 先見性:孤立したエージェントから相互接続エージェントエコシステムへの進化という技術トレンドを正確に把握しています
- 実用性:学術研究と産業実践を組み合わせ、具体的なプロトタイプケースと応用シナリオを提供しています
- 構造の明確性:階層的分析フレームワークは複雑なIoAエコシステムの理解を容易にします
- 定量分析の欠如:総説論文として、具体的なパフォーマンス評価と実験検証が不足しています
- 技術詳細の限定:共識メカニズムやプライバシー保護などの主要技術の説明は比較的マクロ的です
- 課題分析の深さ不足:技術実装の困難さと解決策の分析をより具体的にすることができます
- 領域への貢献:IoAという新興領域に重要な理論的フレームワークと研究基盤を提供しています
- 実用的価値:産業界がIoAシステムを開発する際のアーキテクチャ指導と技術ロードマップを提供しています
- 研究指導:特定された7つの将来研究方向は学術界に明確な研究議題を提供しています
このフレームワークは、スマートシティ、インダストリー4.0、自動運転車隊、分散AI推論など、大規模エージェント協調が必要なシナリオに適用可能です。特に、組織間、ドメイン間の協調が必要な複雑な応用シナリオに適しています。
論文は149の関連文献を引用しており、マルチエージェントシステム、大規模言語モデル、通信プロトコル、ブロックチェーン技術など複数の関連領域の重要な研究を網羅し、IoA研究に堅実な理論的基盤を提供しています。
総括:本論文で提案されたIoAコンセプトとフレームワークは重要な理論的価値と実践的意義を持ち、次世代エージェント相互接続インフラストラクチャの構築に包括的な指導を提供しています。総説論文として技術詳細と実験検証の面で限界がありますが、その先見性と体系性により、この領域の重要な参考文献となっています。