2025-11-25T00:01:17.449679

Internet of Agents: Fundamentals, Applications, and Challenges

Wang, Guo, Pan et al.

With the rapid proliferation of large language models and vision-language models, AI agents have evolved from isolated, task-specific systems into autonomous, interactive entities capable of perceiving, reasoning, and acting without human intervention. As these agents proliferate across virtual and physical environments, from virtual assistants to embodied robots, the need for a unified, agent-centric infrastructure becomes paramount. In this survey, we introduce the Internet of Agents (IoA) as a foundational framework that enables seamless interconnection, dynamic discovery, and collaborative orchestration among heterogeneous agents at scale. We begin by presenting a general IoA architecture, highlighting its hierarchical organization, distinguishing features relative to the traditional Internet, and emerging applications. Next, we analyze the key operational enablers of IoA, including capability notification and discovery, adaptive communication protocols, dynamic task matching, consensus and conflict-resolution mechanisms, and incentive models. Finally, we identify open research directions toward building resilient and trustworthy IoA ecosystems.

academic

Интернет Агентов: Основы, Приложения и Вызовы

Основная информация

ID статьи: 2505.07176
Название: Internet of Agents: Fundamentals, Applications, and Challenges
Авторы: Yuntao Wang, Shaolong Guo, Yanghe Pan, Zhou Su, Fahao Chen, Tom H. Luan, Peng Li, Jiawen Kang, Dusit Niyato
Классификация: cs.MA (Многоагентные системы), cs.AI (Искусственный интеллект)
Дата публикации: Январь 2025 г. (Принято IEEE TCCN в октябре 2025 г.)
Ссылка на статью: https://arxiv.org/abs/2505.07176

Аннотация

С быстрым распространением больших языковых моделей и визуально-языковых моделей ИИ-агенты эволюционировали от изолированных, специализированных систем к автономным интерактивным сущностям, способным воспринимать, рассуждать и действовать без вмешательства человека. По мере широкого развертывания этих агентов в виртуальной и физической среде, от виртуальных помощников до воплощенных роботов, становится критически важным построение единой, ориентированной на агентов инфраструктуры. Данный обзор представляет Интернет Агентов (IoA) как фундаментальную основу, обеспечивающую беспрепятственное взаимодействие, динамическое обнаружение и совместную оркестрацию крупномасштабных гетерогенных агентов. В статье сначала предлагается универсальная архитектура IoA, подчеркивающая её иерархическую организацию, отличительные характеристики по сравнению с традиционным Интернетом и возникающие приложения. Затем анализируются ключевые операционные технологии IoA, включая объявление и обнаружение возможностей, адаптивные протоколы связи, динамическое сопоставление задач, механизмы консенсуса и разрешения конфликтов, а также модели стимулирования. Наконец, выявляются открытые направления исследований для построения устойчивой и надежной экосистемы IoA.

Исследовательский контекст и мотивация

Основные проблемы

Основные проблемы, которые решает данное исследование, заключаются в том, как построить единую инфраструктуру для поддержки взаимодействия, сотрудничества и оркестрации крупномасштабных гетерогенных ИИ-агентов. В частности:

Вызовы взаимосвязи: Существующие многоагентные системы в основном работают в симуляции на одном устройстве, тогда как фактическое развертывание IoA требует охвата миллиардов географически распределенных агентов, каждый с уникальными профилями вычислительных ресурсов, сетевых возможностей, восприятия и энергоснабжения.
Собственные интерфейсы агентов: Текущие компьютерные агенты (такие как OpenAI Operator) полагаются на имитацию операций графического интерфейса человека для управления браузерами и приложениями, создавая высокие затраты на захват экрана.
Автономное сотрудничество: IoA содержит физические и виртуальные агенты, работающие в высокодинамичной среде, требующие способности агентов к самоорганизации и самопереговорам для формирования низкозатратных и эффективных сетей сотрудничества.

Важность проблемы

С быстрым развитием ИИ-агентов Gartner прогнозирует, что к 2028 году по крайней мере 15% повседневных задач будут автономно выполняться ИИ-агентами, а 33% корпоративных приложений будут интегрировать интеллект, управляемый агентами. Агенты становятся "новыми гражданами" цифрового и физического пространства, переформатируя экономическую структуру и взаимодействие человеческого общества.

Ограничения существующих подходов

Существующие исследования в основном сосредоточены на многоагентных системах (MAS) и сталкиваются с тремя основными вызовами:

Изолированные экосистемы: Существующие фреймворки ограничивают агентов собственной средой, ограничивая интеграцию сторонних агентов
Симуляция на одном устройстве: Большинство MAS ограничены симуляцией на одном устройстве, что контрастирует с реальными сценариями, где агенты работают на нескольких устройствах и географических местоположениях
Жесткая коммуникация и координация: Существующие протоколы агентов и переходы состояний в основном жестко закодированы, не отражая динамичный, специфичный для задач характер фактического сотрудничества

Основные вклады

Универсальная архитектура IoA: Предоставляет полный обзор архитектуры IoA, описывая её иерархическую структуру, отличительные характеристики по сравнению с традиционным Интернетом, ключевые особенности и возникающие приложения
Ключевые технологии IoA: Анализирует ключевые технологии, поддерживающие IoA, включая объявление и обнаружение возможностей, динамическую оркестрацию и сопоставление задач, адаптивные протоколы связи, механизмы консенсуса и разрешения конфликтов, экономические модели и нормативные модели
Выявление открытых вызовов: Определяет нерешённые проблемы в области IoA, указывая на будущие направления исследований, способствующие широкому внедрению и устойчивому развитию

Подробное описание методологии

Проектирование архитектуры IoA

Иерархическая архитектура

IoA использует четырёхуровневую архитектуру:

Уровень инфраструктуры: Интегрирует ключевые ресурсы, включая модели ИИ, данные, знания, вычисления и коммуникации, включая базовые модели (такие как GPT-4o, DeepSeek-R1), многомодальную инфраструктуру данных и технологии связи (5G URLLC, сетевые сетки и т.д.)
Уровень управления агентами: Управляет идентичностью, возможностями, обнаружением и жизненным циклом агентов в IoA, поддерживая децентрализованные идентификаторы (DID), семантическое моделирование возможностей и механизмы публикации-подписки
Уровень координации агентов: Управляет распределённым выполнением задач и сотрудничеством агентов, поддерживая декомпозицию задач, оркестрацию процессов, адаптивные протоколы связи и динамическое сопоставление агент-задача
Уровень приложений: Предоставляет стандартизированные интерфейсы и семантическое выравнивание, поддерживая кроссмодальную, семантическую и интеграцию на уровне знаний

Функциональные модули агента

Каждый агент IoA содержит четыре основных функциональных модуля:

Модуль планирования: Основан на рассуждениях больших моделей, декомпозиции задач и принятии решений, включая технологии цепочки мыслей (CoT), дерева мыслей (ToT) и другие
Модуль памяти: Поддерживает краткосрочный контекст и долгосрочные знания, поддерживая непрерывное обучение и персонализацию
Модуль взаимодействия: Реализует коммуникационное сотрудничество через интерфейсы человека, агента и окружающей среды
Модуль действия: Реализует выполнение планов через физические исполнители и интерфейсы программных инструментов

Ключевые технологические инновации

Объявление и обнаружение возможностей

Оценка возможностей: Объединяет самоотчётные декларации и системную верификацию для построения профилей возможностей агентов
Объявление возможностей: Использует стратегии активного уведомления, срабатывания по событиям и периодической синхронизации
Поиск возможностей: Развивается от традиционного поиска к семантическому поиску, поиску, дополненному знаниями, и поиску, дополненному агентами

Структура взаимодействия и оркестрация задач

Режимы взаимодействия: Агрегация, рефлексия, дебаты, использование инструментов и другие режимы сотрудничества
Топология коммуникации: Цепочка, звезда, дерево, граф и другие сетевые структуры
Декомпозиция задач: Методы декомпозиции на основе правил и методы на основе обучения
Распределение задач: Стратегии маршрутизированного распределения и самоорганизующегося распределения

Протоколы связи

Сравниваются пять представительных протоколов:

MCP (Model Context Protocol): Архитектура клиент-сервер, предложенная Anthropic
A2A (Agent-to-Agent): Протокол P2P взаимодействия, предложенный Google
ANP (Agent Network Protocol): Полностью децентрализованная архитектура P2P
AGNTCY: Гибридная архитектура для содействия стандартизированному сотрудничеству
Agora: Исследовательский проект, балансирующий эффективность, универсальность и портативность

Экспериментальная установка и сценарии приложений

Практические прототипы IoA

В статье анализируются несколько представительных реализаций IoA:

Прототип IoA Chen и др.: Использует иерархическую архитектуру клиент-сервер, поддерживающую сотрудничество гетерогенных виртуальных агентов
Система DAWN: Поддерживает иерархическую архитектуру для глобального распределённого сотрудничества IoA
Промышленный помощник Siemens: Применяется на протяжении всего жизненного цикла производства автономными агентами
Фабрика интеллектуальных агентов Midea: Развёртывание 14 агентов на 38 производственных сценариях

Сценарии приложений

Статья подробно описывает пять представительных сценариев приложений:

Умный дом: P2P коммуникация в подсети домашних агентов
Здравоохранение: Координация роботов в медицинских учреждениях
Умная фабрика: Координация полевых и внешних агентов
Умная электросеть: Управление энергией через подсети IoA и внешних агентов
Умный город: Сети агентов, охватывающие несколько доменов

Результаты экспериментов и анализ

Ключевые характеристики IoA

Статья выявляет шесть ключевых характеристик IoA:

Автономный интеллект: Агенты обладают высокой степенью автономии, способны активно объявлять возможности и независимо инициировать сотрудничество
Высокая динамичность: Поддерживает создание, миграцию и завершение агентов по требованию, а также переконфигурацию рабочих процессов в реальном времени
Высокая гетерогенность: Охватывает широкий спектр от узлов микроконтроллеров до агентов, управляемых кластерами GPU
Крупномасштабная масштабируемость: Поддерживает масштабирование от небольших временных команд агентов до миллиардов кроссдоменных агентов
Семантически осведомленная коммуникация: Основана на контекстно-осведомленном семантическом понимании и возможностях рассуждения больших моделей
Сотрудничество, управляемое задачами: Приоритизирует сети, ориентированные на задачи, где агенты динамически адаптируют возможности для соответствия требованиям задач

Сравнение с традиционными системами

Статья систематически сравнивает IoA с традиционным Интернетом и IoT:

Измерение	Традиционный Интернет	IoT	IoA
Основная цель	Соединение хостов и информации	Соединение устройств и информации	Соединение агентов и знаний
Архитектура	Централизованная (клиент-сервер)	Децентрализованная (край-облако)	Гибридная (P2P+прокси)
Режим взаимодействия	Пассивный (запрос-ответ)	Управляемый событиями	Активный (ориентированный на цели)
Уровень коммуникации	Передача на уровне битов	Уровень битов + лёгкие протоколы	Семантический обмен
Источник автономии	Управление человеком	Логика устройства на основе правил	Интеллект агентов, управляемый большими моделями

Будущие направления исследований

Семь ключевых направлений исследований

Стандартизация и фреймворк взаимодействия IoA: Разработка единого стандартизированного фреймворка для обеспечения кроссплатформной и кроссдоменной взаимодействия
Безопасные адаптивные протоколы коммуникации агентов: Решение триады универсальности-эффективности-портативности с встроенными строгими гарантиями безопасности
Децентрализованная автономная экосистема агентов: Разработка автономных механизмов без центральной власти, аналогичных биологическим экосистемам
Экономические системы на основе агентов: Интеграция адаптивных механизмов стимулирования, объединяющих краткосрочные экономические вознаграждения, чувствительные к ёмкости, и долгосрочное отслеживание репутации
Защита приватности при взаимодействии агентов: Интеграция контекстно-осведомленного и управляемого задачами дизайна приватности, позволяющего агентам динамически согласовывать уровни защиты приватности на основе критичности задачи
Кибер-физическая безопасность IoA: Интеграция кибер-физической защиты, такой как обнаружение ложных инъекций данных в электросетях путём связывания сетевого трафика агентов с показаниями фазовых измерительных устройств
Этически совместимая IoA: Обеспечение соответствия этическим требованиям требует прозрачного морального рассуждения и адаптивного семантического выравнивания

Заключение и обсуждение

Основные выводы

IoA представляет собой инфраструктуру следующего поколения для автономных взаимосвязанных интеллектуальных систем, предоставляя комплексный фреймворк для крупномасштабного сотрудничества гетерогенных агентов. Благодаря иерархической архитектуре, механизмам динамического обнаружения, адаптивным протоколам связи и моделям экономического стимулирования, IoA может поддерживать широкий спектр сценариев приложений от умных домов до умных городов.

Ограничения

Вызовы масштабируемости: Координация в реальном времени и механизмы консенсуса в крупномасштабных системах IoA по-прежнему сталкиваются с ограничениями задержки и пропускной способности
Проблемы безопасности и приватности: Сотрудничество кроссдоменных агентов вводит новые поверхности атак и риски утечки приватности
Недостаточная стандартизация: Отсутствует единый язык описания агентов и лёгкие протоколы связи
Сложность экономических моделей: Разработка взаимодействующих и справедливых экономических фреймворков между гетерогенными платформами IoA остаётся сложной задачей

Будущие направления

Статья указывает, что зрелость IoA требует постоянных инноваций в архитектуре сетей, стандартах взаимодействия и парадигмах безопасности, особенно при решении проблем крупномасштабного развёртывания, кроссдоменного сотрудничества и этического соответствия.

Глубокая оценка

Преимущества

Комплексность: Предоставляет первый систематический обзор области IoA, охватывающий проектирование архитектуры, ключевые технологии, сценарии приложений и будущие направления
Перспективность: Точно отражает технологические тренды эволюции от изолированных агентов к взаимосвязанным экосистемам агентов
Практичность: Объединяет академические исследования и промышленную практику, предоставляя конкретные примеры прототипов и сценарии приложений
Ясная структура: Иерархический фреймворк анализа облегчает понимание сложной экосистемы IoA

Недостатки

Отсутствие количественного анализа: Как обзорная статья, ей не хватает конкретных оценок производительности и экспериментальной верификации
Ограниченные технические детали: Описание некоторых ключевых технологий (таких как механизмы консенсуса, защита приватности) относительно макроскопично
Недостаточно глубокий анализ вызовов: Анализ технических сложностей реализации и решений может быть более конкретным

Влияние

Вклад в область: Предоставляет важный теоретический фреймворк и исследовательскую основу для возникающей области IoA
Практическая ценность: Предоставляет архитектурное руководство и технологическую дорожную карту для разработки систем IoA в промышленности
Исследовательское руководство: Выявленные семь направлений будущих исследований предоставляют чёткую исследовательскую повестку дня для академического сообщества

Применимые сценарии

Данный фреймворк применим к сценариям, требующим крупномасштабного сотрудничества агентов, включая умные города, Индустрию 4.0, флоты автономных транспортных средств, распределённый вывод ИИ и другие области, особенно подходящие для сложных сценариев приложений, требующих кроссорганизационного и кроссдоменного сотрудничества.

Библиография

Статья цитирует 149 связанных работ, охватывающих многоагентные системы, большие языковые модели, протоколы связи, технологию блокчейна и другие связанные области, предоставляя прочную теоретическую основу для исследований IoA.

Резюме: Предложенная в статье концепция и фреймворк IoA имеют важное теоретическое значение и практическую ценность, предоставляя комплексное руководство для построения инфраструктуры взаимосвязанных агентов следующего поколения. Хотя как обзорная статья она имеет ограничения в технических деталях и экспериментальной верификации, её перспективность и систематичность делают её важным справочным материалом в данной области.