Real-world AI systems are tackling increasingly complex problems, often through interactions among large language model (LLM) agents. When these agents develop inconsistent conventions, coordination can break down. Applications such as collaborative coding and distributed planning therefore require reliable, consistent communication, and scalability is a central concern as systems grow. We introduce Schema-Induced Games for Naming (SIGN), a naming game that examines how lightweight structure can steer convention formation. We compare schema-induced communication to unconstrained natural language and find faster convergence with up to 5.8x higher agreement. These results suggest that minimal structure can act as a simple control knob for efficient multi-agent coordination, pointing toward broader applications beyond the naming game.
Реальные системы искусственного интеллекта решают все более сложные задачи, часто через взаимодействие агентов на основе больших языковых моделей (LLM). Когда эти агенты формируют несогласованные соглашения, координация может нарушиться. Приложения, такие как совместное кодирование и распределённое планирование, требуют надёжной, согласованной коммуникации, при этом масштабируемость является ключевой проблемой роста системы. В данной статье представлена система Schema-Induced Games for Naming (SIGN) — игра именования, исследующая, как лёгкие структурные ограничения направляют формирование соглашений. Исследование сравнивает схема-индуцированную коммуникацию с неограниченным естественным языком, обнаруживая, что первая сходится быстрее с улучшением согласованности до 5,8 раза. Эти результаты показывают, что минимальная структура может служить простым управляющим рычагом для эффективной многоагентной координации, указывая на более широкие приложения за пределами игр именования.
С развитием многоагентных систем на основе LLM агентам необходимо установить общие соглашения об именовании для эффективной координации. Когда агенты формируют несогласованные соглашения при взаимодействии, это приводит к сбоям координации, влияя на практические приложения, такие как совместное кодирование и распределённое планирование. Данная работа исследует, как через лёгкие структурированные ограничения можно направить формирование соглашений, повышая согласованность между агентами и скорость сходимости.
Практические требования приложений: многоагентные системы в реальных приложениях (например, совместное кодирование, распределённое планирование) требуют надёжных протоколов коммуникации
Вызовы масштабируемости: с ростом размера системы поддержание согласованности становится всё более сложным
Требования эффективности: снижение стоимости взаимодействия (потребления токенов) для достижения консенсуса критично для практического развёртывания
Коммуникация на естественном языке: хотя гибкая, но лишена структурности, что приводит к медленному и нестабильному формированию соглашений
Полностью свободное возникновение соглашений: формирование соглашений, основанное на чистом взаимодействии, неэффективно и требует большого количества взаимодействий для достижения консенсуса
Отсутствие механизмов управления: существующие исследования не предлагают простых и эффективных средств управления для направления формирования соглашений
Предложена структура SIGN: впервые введены схема-индуцированные механизмы в игры именования, исследуется, как структурированные ограничения влияют на формирование соглашений агентами LLM
Скорость достижения согласованности повышена на порядок (значительное снижение потребления токенов)
Групповая согласованность повышена до 5,8 раза (с 0,111 до 0,639)
Предоставлен управляемый механизм координации: демонстрируется, что ограничения схемы могут служить модель-независимым "управляющим рычагом", просто и эффективно улучшая многоагентную координацию
Кросс-модельная верификация: метод верифицирован на моделях Phi-3 и LLaMA, а также на их гибридных популяциях
Теоретические insights: раскрыто, как минимальные структурные приоры формируют процесс возникновения соглашений, предоставляя руководство для проектирования многоагентных систем
Принудительный формат: требует ответ в формате @say {name: Ck}
Механизм парсинга: использует регулярные выражения для извлечения токена Ck
Обработка ошибок:
Несоответствующий вывод получает одну повторную попытку (с напоминанием)
Если всё ещё неправильно, декодируется свободный текст
Если полностью не декодируется, устанавливается y ← None
Философия проектирования: предоставляет явные, легко парсируемые дескрипторы словарных записей, сохраняя прозрачность для слушателя с минимальными затратами
Входные данные: N(количество агентов), L(словарь), K(размер памяти), T(раунды), α(вероятность принятия)
для t = 1 до T:
1. Равномерно случайно выбрать пару агентов i, j
2. Каждый агент формирует предложение m^t на основе K последних воспоминаний о партнёре
3. Распарсить @say {name: Ck} → y
4. если несоответствие:
повторить с напоминанием один раз
если всё ещё неправильно:
декодировать свободный текст
если не декодируется:
y ← None
5. если y_i ≠ y_j:
с вероятностью α принять Ck партнёра (механизм lose-shift)
Лёгкие схемы эффективно направляют формирование соглашений: фиксированный формат @say {name: Ck} повышает согласованность агентов LLM в игре именования до 5.8 раза
Значительное улучшение эффективности: для достижения одинакового уровня согласованности Schema требует на порядок меньше токенов
Верификация устойчивости: эффект остаётся стабильным в различных моделях (Phi-3, LLaMA), размерах популяции (12, 24) и гетерогенных установках
Мощь минимальных структурных приоров: даже очень простые структурные ограничения значительно формируют процесс возникновения
Практический механизм управления: ограничения схемы предоставляют модель-независимый, легко реализуемый инструмент координации
Отсутствие объяснения механизма: почему простой формат метки так эффективен? Снижает ли он пространство поиска? Улучшает ли точность парсинга? Или что-то другое?
Отсутствие анализа сходимости: не предоставляются теоретические гарантии (такие как границы скорости сходимости)
Немонотонность α не объяснена: почему α=0.5 лучше, чем α=0.9? Требуется более глубокий анализ
Ashery, A. F.; Aiello, L. M.; Baronchelli, A. (2025). Emergent social conventions and collective bias in LLM populations. Science Advances, 11(20): eadu9368.
Возникновение социальных соглашений в популяциях LLM
Baronchelli, A.; Loreto, V.; Steels, L. (2008). In-depth analysis of the Naming Game dynamics: the homogeneous mixing case. arXiv:0803.0398.
Классический теоретический анализ игры именования
Chen, W. et al. (2024). Beyond natural language: LLMs leveraging alternative formats for enhanced reasoning and communication. arXiv:2402.18439.
Статья SIGN предлагает простую, но мощную идею: направлять формирование соглашений в многоагентных системах через минимальные структурированные ограничения. Результаты экспериментов впечатляют: 5.8-кратное улучшение согласованности и улучшение эффективности на порядок обеспечивают сильную поддержку для практических приложений.
Основная ценность заключается в предоставлении низкостоимостного, высокоэффективного, модель-независимого механизма координации, что имеет значительное значение в контексте растущей важности многоагентных систем LLM. Простота метода сама по себе является преимуществом — без необходимости сложного обучения или архитектурных модификаций, просто через ограничение формата вывода можно значительно улучшить координацию.
Основные ограничения — это теоретическая глубина и диапазон приложений. Статья больше демонстрирует эмпирически, чем анализирует глубоко; будущие работы должны ответить на вопросы "почему" и "когда". Расширение на более сложные задачи и более крупные масштабы — необходимый следующий шаг.
В целом, это хорошо выполненная исследовательская работа с чёткими вкладами, предоставляющая практические инструменты для многоагентной координации и исследовательские insights, заслуживающая внимания и дальнейшего изучения.