With the rapid proliferation of large language models and vision-language models, AI agents have evolved from isolated, task-specific systems into autonomous, interactive entities capable of perceiving, reasoning, and acting without human intervention. As these agents proliferate across virtual and physical environments, from virtual assistants to embodied robots, the need for a unified, agent-centric infrastructure becomes paramount. In this survey, we introduce the Internet of Agents (IoA) as a foundational framework that enables seamless interconnection, dynamic discovery, and collaborative orchestration among heterogeneous agents at scale. We begin by presenting a general IoA architecture, highlighting its hierarchical organization, distinguishing features relative to the traditional Internet, and emerging applications. Next, we analyze the key operational enablers of IoA, including capability notification and discovery, adaptive communication protocols, dynamic task matching, consensus and conflict-resolution mechanisms, and incentive models. Finally, we identify open research directions toward building resilient and trustworthy IoA ecosystems.
academicInternet of Agents: Fundamentals, Applications, and Challenges
- 论文ID: 2505.07176
- 标题: Internet of Agents: Fundamentals, Applications, and Challenges
- 作者: Yuntao Wang, Shaolong Guo, Yanghe Pan, Zhou Su, Fahao Chen, Tom H. Luan, Peng Li, Jiawen Kang, Dusit Niyato
- 分类: cs.MA (Multi-Agent Systems), cs.AI (Artificial Intelligence)
- 发表时间: 2025年1月 (Accepted by IEEE TCCN in Oct. 2025)
- 论文链接: https://arxiv.org/abs/2505.07176
随着大语言模型和视觉语言模型的快速普及,AI智能体已从孤立的、特定任务的系统演进为能够感知、推理和行动的自主交互实体,无需人工干预。随着这些智能体在虚拟和物理环境中的广泛部署,从虚拟助手到具身机器人,构建统一的、以智能体为中心的基础设施变得至关重要。本综述引入了智能体互联网(IoA)作为基础框架,实现大规模异构智能体间的无缝互联、动态发现和协作编排。文章首先提出了通用IoA架构,突出其层次化组织、相对于传统互联网的区别特征和新兴应用。接着分析IoA的关键操作使能技术,包括能力通知与发现、自适应通信协议、动态任务匹配、共识与冲突解决机制以及激励模型。最后,识别了构建弹性和可信IoA生态系统的开放研究方向。
本研究要解决的核心问题是如何构建一个统一的基础设施来支持大规模异构AI智能体的互联、协作和编排。具体包括:
- 互联互通挑战:现有多智能体系统主要在单设备上模拟运行,而实际IoA部署需要跨越数十亿地理分布的智能体,每个都有独特的计算、网络、感知和能源配置文件。
- 智能体原生接口:当前的计算机使用智能体(如OpenAI的Operator)依赖模仿人类GUI操作来控制浏览器和应用,产生高昂的屏幕抓取开销。
- 自主协作:IoA包含在高度动态环境中运行的物理和虚拟智能体,需要智能体能够自组织、自协商,形成低成本、高效率的协作网络。
随着AI智能体的快速发展,Gartner预测到2028年,至少15%的日常任务将由AI智能体自主执行,33%的企业应用将整合智能体驱动的智能。智能体正成为数字和物理空间的"新公民",重塑经济结构和人类社会互动。
现有研究主要关注多智能体系统(MAS),存在三个主要挑战:
- 生态系统孤立:现有框架将智能体限制在自己的环境中,限制了第三方智能体的集成
- 单设备模拟:大多数MAS局限于单设备模拟,与智能体跨多设备和地理位置运行的现实场景形成鲜明对比
- 刚性通信和协调:现有智能体协议和状态转换多为硬编码,无法捕捉实际协作的动态、任务特定性质
- 通用IoA架构:提供了IoA架构的整体概览,概述其层次化框架、与传统互联网的区别特征、关键特性和新兴应用
- IoA关键使能技术:分析支持IoA的关键使能技术,包括能力通知与发现、动态任务编排与匹配、自适应通信协议、共识与冲突解决机制、经济模型和监管模型
- 开放挑战识别:识别IoA领域的未解决问题,指出促进其广泛采用和可持续发展的未来研究方向
IoA采用四层架构设计:
- 基础设施层:集成AI模型、数据、知识、计算和通信等关键资源,包括基础模型(如GPT-4o、DeepSeek-R1)、多模态数据基础设施和通信技术(5G URLLC、网格网络等)
- 智能体管理层:管理IoA中智能体的身份、能力、发现和生命周期,支持去中心化标识符(DID)、能力语义建模和发布-订阅机制
- 智能体协调层:管理分布式任务执行和智能体协作,支持任务分解、流程编排、自适应通信协议和动态智能体-任务匹配
- 应用层:提供标准化接口和语义对齐,支持跨模态、语义和知识级集成
每个IoA智能体包含四个核心功能模块:
- 规划模块:基于大模型的推理、任务分解和决策制定,包括链式思维(CoT)、树式思维(ToT)等技术
- 记忆模块:维护短期上下文和长期知识,支持持续学习和个性化
- 交互模块:实现跨人类、智能体和环境接口的通信协作
- 行动模块:通过物理执行器和软件工具接口实现计划执行
- 能力评估:结合自报告声明和系统验证,构建智能体能力档案
- 能力通知:采用主动通知、事件触发和周期同步策略
- 能力检索:从传统搜索发展到语义检索、知识增强和智能体增强检索
- 交互模式:聚合、反思、辩论、工具使用等多种协作模式
- 通信拓扑:链式、星型、树型、图型等网络结构
- 任务分解:基于规则和基于学习的分解方法
- 任务分配:路由分配和自组织分配策略
比较了五种代表性协议:
- MCP (Model Context Protocol):Anthropic提出的客户端-服务器架构
- A2A (Agent-to-Agent):Google提出的P2P交互协议
- ANP (Agent Network Protocol):完全去中心化P2P架构
- AGNTCY:混合架构促进标准化协作
- Agora:平衡效率、通用性和可移植性的研究项目
论文分析了几个代表性的IoA实现:
- Chen等人的IoA原型:采用分层客户端-服务器架构,支持异构虚拟智能体协作
- DAWN系统:支持全球分布式IoA协作的层次化架构
- 西门子工业副驾驶:应用于整个生产生命周期的自主智能体
- 美的智能体工厂:部署14个智能体跨38个生产场景
文章详细描述了五个代表性应用场景:
- 智能家居:家庭智能体子网内的P2P通信
- 医疗保健:医疗设施内机器人协调
- 智能工厂:现场和外部智能体协调
- 智能电网:通过IoA子网和外部智能体进行能源管理
- 智慧城市:跨域智能体网络
论文识别了IoA的六个关键特征:
- 自主智能:智能体具有高度自主性,能够主动发布能力并独立发起协作
- 高动态性:支持智能体的按需创建、迁移和终止,以及实时工作流重配置
- 高异构性:涵盖从微控制器节点到GPU集群驱动智能体的广泛频谱
- 大规模可扩展性:支持从小型临时智能体团队到数十亿跨域智能体的扩展
- 语义感知通信:基于大模型的上下文感知语义理解和推理能力
- 任务驱动合作:优先考虑面向任务的网络,智能体动态调整能力以匹配任务需求
论文系统比较了IoA与传统互联网和IoT的区别:
| 维度 | 传统互联网 | IoT | IoA |
|---|
| 核心目标 | 主机与信息连接 | 设备与信息连接 | 智能体与知识连接 |
| 架构 | 中心化(客户端-服务器) | 去中心化(端-边-云) | 混合(P2P+代理) |
| 交互模式 | 被动(请求-响应) | 事件驱动 | 主动(目标导向) |
| 通信级别 | 比特级传输 | 比特级+轻量协议 | 语义级交换 |
| 自主性来源 | 人工控制 | 基于规则的设备逻辑 | 大模型驱动的智能体智能 |
- IoA标准化和互操作性框架:开发统一的标准化框架确保跨平台和跨域互操作性
- 安全自适应智能体通信协议:处理通用性-效率-可移植性三难困境,嵌入严格的安全保证
- 去中心化自治智能体生态系统:开发无需中央权威的自治机制,类似生物生态系统
- 基于智能体的经济系统:集成自适应激励机制,结合短期容量感知经济奖励和长期声誉跟踪
- 隐私保护智能体交互:集成上下文感知和任务驱动的隐私设计,允许智能体基于任务关键性动态协商隐私保护级别
- 网络物理安全IoA:集成网络物理防御,如电网智能体关联网络流量与相量测量单元读数检测虚假数据注入
- 伦理互操作IoA:确保伦理合规需要透明的道德推理和自适应语义对齐
IoA代表了自主互联智能系统的下一代基础设施,提供了异构智能体大规模协作的全面框架。通过层次化架构、动态发现机制、自适应通信协议和经济激励模型,IoA能够支持从智能家居到智慧城市的广泛应用场景。
- 可扩展性挑战:大规模IoA系统中的实时协调和共识机制仍面临延迟和吞吐量限制
- 安全隐私问题:跨域智能体协作引入新的攻击面和隐私泄露风险
- 标准化不足:缺乏统一的智能体描述语言和轻量级通信协议
- 经济模型复杂性:在异构IoA平台间开发可互操作和公平的经济框架仍具挑战性
论文指出IoA的成熟需要在网络架构、互操作性标准和安全范式方面的持续创新,特别是在处理大规模部署、跨域协作和伦理合规方面。
- 全面性:提供了IoA领域的首个系统性综述,涵盖架构设计、关键技术、应用场景和未来方向
- 前瞻性:准确把握了从孤立智能体向互联智能体生态系统演进的技术趋势
- 实用性:结合了学术研究和工业实践,提供了具体的原型案例和应用场景
- 结构清晰:层次化的分析框架便于理解复杂的IoA生态系统
- 缺乏定量分析:作为综述论文,缺乏具体的性能评估和实验验证
- 技术细节有限:对某些关键技术(如共识机制、隐私保护)的描述相对宏观
- 挑战分析不够深入:对技术实现难点和解决方案的分析可以更加具体
- 领域贡献:为IoA这一新兴领域提供了重要的理论框架和研究基础
- 实用价值:为工业界开发IoA系统提供了架构指导和技术路线图
- 研究指导:识别的七个未来研究方向为学术界提供了明确的研究议程
该框架适用于需要大规模智能体协作的场景,包括智慧城市、工业4.0、自动驾驶车队、分布式AI推理等领域,特别适合需要跨组织、跨域协作的复杂应用场景。
论文引用了149篇相关文献,涵盖了多智能体系统、大语言模型、通信协议、区块链技术等多个相关领域的重要工作,为IoA研究提供了坚实的理论基础。
总结:本文提出的IoA概念和框架具有重要的理论价值和实践意义,为构建下一代智能体互联基础设施提供了全面的指导。虽然作为综述论文在技术细节和实验验证方面存在局限,但其前瞻性和系统性使其成为该领域的重要参考文献。