2025-11-25T00:01:17.449679

Internet of Agents: Fundamentals, Applications, and Challenges

Wang, Guo, Pan et al.

With the rapid proliferation of large language models and vision-language models, AI agents have evolved from isolated, task-specific systems into autonomous, interactive entities capable of perceiving, reasoning, and acting without human intervention. As these agents proliferate across virtual and physical environments, from virtual assistants to embodied robots, the need for a unified, agent-centric infrastructure becomes paramount. In this survey, we introduce the Internet of Agents (IoA) as a foundational framework that enables seamless interconnection, dynamic discovery, and collaborative orchestration among heterogeneous agents at scale. We begin by presenting a general IoA architecture, highlighting its hierarchical organization, distinguishing features relative to the traditional Internet, and emerging applications. Next, we analyze the key operational enablers of IoA, including capability notification and discovery, adaptive communication protocols, dynamic task matching, consensus and conflict-resolution mechanisms, and incentive models. Finally, we identify open research directions toward building resilient and trustworthy IoA ecosystems.

academic

Internet of Agents: Fundamentals, Applications, and Challenges

基本信息

论文ID: 2505.07176
标题: Internet of Agents: Fundamentals, Applications, and Challenges
作者: Yuntao Wang, Shaolong Guo, Yanghe Pan, Zhou Su, Fahao Chen, Tom H. Luan, Peng Li, Jiawen Kang, Dusit Niyato
分类: cs.MA (Multi-Agent Systems), cs.AI (Artificial Intelligence)
发表时间: 2025年1月 (Accepted by IEEE TCCN in Oct. 2025)
论文链接: https://arxiv.org/abs/2505.07176

摘要

随着大语言模型和视觉语言模型的快速普及，AI智能体已从孤立的、特定任务的系统演进为能够感知、推理和行动的自主交互实体，无需人工干预。随着这些智能体在虚拟和物理环境中的广泛部署，从虚拟助手到具身机器人，构建统一的、以智能体为中心的基础设施变得至关重要。本综述引入了智能体互联网(IoA)作为基础框架，实现大规模异构智能体间的无缝互联、动态发现和协作编排。文章首先提出了通用IoA架构，突出其层次化组织、相对于传统互联网的区别特征和新兴应用。接着分析IoA的关键操作使能技术，包括能力通知与发现、自适应通信协议、动态任务匹配、共识与冲突解决机制以及激励模型。最后，识别了构建弹性和可信IoA生态系统的开放研究方向。

研究背景与动机

核心问题

本研究要解决的核心问题是如何构建一个统一的基础设施来支持大规模异构AI智能体的互联、协作和编排。具体包括：

互联互通挑战：现有多智能体系统主要在单设备上模拟运行，而实际IoA部署需要跨越数十亿地理分布的智能体，每个都有独特的计算、网络、感知和能源配置文件。
智能体原生接口：当前的计算机使用智能体(如OpenAI的Operator)依赖模仿人类GUI操作来控制浏览器和应用，产生高昂的屏幕抓取开销。
自主协作：IoA包含在高度动态环境中运行的物理和虚拟智能体，需要智能体能够自组织、自协商，形成低成本、高效率的协作网络。

问题重要性

随着AI智能体的快速发展，Gartner预测到2028年，至少15%的日常任务将由AI智能体自主执行，33%的企业应用将整合智能体驱动的智能。智能体正成为数字和物理空间的"新公民"，重塑经济结构和人类社会互动。

现有方法局限性

现有研究主要关注多智能体系统(MAS)，存在三个主要挑战：

生态系统孤立：现有框架将智能体限制在自己的环境中，限制了第三方智能体的集成
单设备模拟：大多数MAS局限于单设备模拟，与智能体跨多设备和地理位置运行的现实场景形成鲜明对比
刚性通信和协调：现有智能体协议和状态转换多为硬编码，无法捕捉实际协作的动态、任务特定性质

核心贡献

通用IoA架构：提供了IoA架构的整体概览，概述其层次化框架、与传统互联网的区别特征、关键特性和新兴应用
IoA关键使能技术：分析支持IoA的关键使能技术，包括能力通知与发现、动态任务编排与匹配、自适应通信协议、共识与冲突解决机制、经济模型和监管模型
开放挑战识别：识别IoA领域的未解决问题，指出促进其广泛采用和可持续发展的未来研究方向

方法详解

IoA架构设计

层次化架构

IoA采用四层架构设计：

基础设施层：集成AI模型、数据、知识、计算和通信等关键资源，包括基础模型(如GPT-4o、DeepSeek-R1)、多模态数据基础设施和通信技术(5G URLLC、网格网络等)
智能体管理层：管理IoA中智能体的身份、能力、发现和生命周期，支持去中心化标识符(DID)、能力语义建模和发布-订阅机制
智能体协调层：管理分布式任务执行和智能体协作，支持任务分解、流程编排、自适应通信协议和动态智能体-任务匹配
应用层：提供标准化接口和语义对齐，支持跨模态、语义和知识级集成

智能体功能模块

每个IoA智能体包含四个核心功能模块：

规划模块：基于大模型的推理、任务分解和决策制定，包括链式思维(CoT)、树式思维(ToT)等技术
记忆模块：维护短期上下文和长期知识，支持持续学习和个性化
交互模块：实现跨人类、智能体和环境接口的通信协作
行动模块：通过物理执行器和软件工具接口实现计划执行

关键技术创新

能力通知与发现

能力评估：结合自报告声明和系统验证，构建智能体能力档案
能力通知：采用主动通知、事件触发和周期同步策略
能力检索：从传统搜索发展到语义检索、知识增强和智能体增强检索

交互结构与任务编排

交互模式：聚合、反思、辩论、工具使用等多种协作模式
通信拓扑：链式、星型、树型、图型等网络结构
任务分解：基于规则和基于学习的分解方法
任务分配：路由分配和自组织分配策略

通信协议

比较了五种代表性协议：

MCP (Model Context Protocol)：Anthropic提出的客户端-服务器架构
A2A (Agent-to-Agent)：Google提出的P2P交互协议
ANP (Agent Network Protocol)：完全去中心化P2P架构
AGNTCY：混合架构促进标准化协作
Agora：平衡效率、通用性和可移植性的研究项目

实验设置与应用场景

实际IoA原型

论文分析了几个代表性的IoA实现：

Chen等人的IoA原型：采用分层客户端-服务器架构，支持异构虚拟智能体协作
DAWN系统：支持全球分布式IoA协作的层次化架构
西门子工业副驾驶：应用于整个生产生命周期的自主智能体
美的智能体工厂：部署14个智能体跨38个生产场景

应用场景

文章详细描述了五个代表性应用场景：

智能家居：家庭智能体子网内的P2P通信
医疗保健：医疗设施内机器人协调
智能工厂：现场和外部智能体协调
智能电网：通过IoA子网和外部智能体进行能源管理
智慧城市：跨域智能体网络

实验结果与分析

IoA关键特征

论文识别了IoA的六个关键特征：

自主智能：智能体具有高度自主性，能够主动发布能力并独立发起协作
高动态性：支持智能体的按需创建、迁移和终止，以及实时工作流重配置
高异构性：涵盖从微控制器节点到GPU集群驱动智能体的广泛频谱
大规模可扩展性：支持从小型临时智能体团队到数十亿跨域智能体的扩展
语义感知通信：基于大模型的上下文感知语义理解和推理能力
任务驱动合作：优先考虑面向任务的网络，智能体动态调整能力以匹配任务需求

与传统系统对比

论文系统比较了IoA与传统互联网和IoT的区别：

维度	传统互联网	IoT	IoA
核心目标	主机与信息连接	设备与信息连接	智能体与知识连接
架构	中心化(客户端-服务器)	去中心化(端-边-云)	混合(P2P+代理)
交互模式	被动(请求-响应)	事件驱动	主动(目标导向)
通信级别	比特级传输	比特级+轻量协议	语义级交换
自主性来源	人工控制	基于规则的设备逻辑	大模型驱动的智能体智能