2025-11-24T23:31:16.955941

SIGN: Schema-Induced Games for Naming

Zhang, WoisetsclÃ¤ger

Real-world AI systems are tackling increasingly complex problems, often through interactions among large language model (LLM) agents. When these agents develop inconsistent conventions, coordination can break down. Applications such as collaborative coding and distributed planning therefore require reliable, consistent communication, and scalability is a central concern as systems grow. We introduce Schema-Induced Games for Naming (SIGN), a naming game that examines how lightweight structure can steer convention formation. We compare schema-induced communication to unconstrained natural language and find faster convergence with up to 5.8x higher agreement. These results suggest that minimal structure can act as a simple control knob for efficient multi-agent coordination, pointing toward broader applications beyond the naming game.

academic

SIGN: Схема-индуцированные игры для именования

Основная информация

ID статьи: 2510.21855
Название: SIGN: Schema-Induced Games for Naming
Авторы: Ryan Zhang (Horace Greeley High School), Herbert Woisetschläger (Technical University of Munich)
Классификация: cs.AI, cs.CL, cs.LG, cs.MA
Дата публикации: 22 октября 2025 г. (препринт arXiv)
Ссылка на статью: https://arxiv.org/abs/2510.21855

Аннотация

Реальные системы искусственного интеллекта решают все более сложные задачи, часто через взаимодействие агентов на основе больших языковых моделей (LLM). Когда эти агенты формируют несогласованные соглашения, координация может нарушиться. Приложения, такие как совместное кодирование и распределённое планирование, требуют надёжной, согласованной коммуникации, при этом масштабируемость является ключевой проблемой роста системы. В данной статье представлена система Schema-Induced Games for Naming (SIGN) — игра именования, исследующая, как лёгкие структурные ограничения направляют формирование соглашений. Исследование сравнивает схема-индуцированную коммуникацию с неограниченным естественным языком, обнаруживая, что первая сходится быстрее с улучшением согласованности до 5,8 раза. Эти результаты показывают, что минимальная структура может служить простым управляющим рычагом для эффективной многоагентной координации, указывая на более широкие приложения за пределами игр именования.

Исследовательский контекст и мотивация

1. Основная решаемая проблема

С развитием многоагентных систем на основе LLM агентам необходимо установить общие соглашения об именовании для эффективной координации. Когда агенты формируют несогласованные соглашения при взаимодействии, это приводит к сбоям координации, влияя на практические приложения, такие как совместное кодирование и распределённое планирование. Данная работа исследует, как через лёгкие структурированные ограничения можно направить формирование соглашений, повышая согласованность между агентами и скорость сходимости.

2. Значимость проблемы

Практические требования приложений: многоагентные системы в реальных приложениях (например, совместное кодирование, распределённое планирование) требуют надёжных протоколов коммуникации
Вызовы масштабируемости: с ростом размера системы поддержание согласованности становится всё более сложным
Требования эффективности: снижение стоимости взаимодействия (потребления токенов) для достижения консенсуса критично для практического развёртывания

3. Ограничения существующих подходов

Коммуникация на естественном языке: хотя гибкая, но лишена структурности, что приводит к медленному и нестабильному формированию соглашений
Полностью свободное возникновение соглашений: формирование соглашений, основанное на чистом взаимодействии, неэффективно и требует большого количества взаимодействий для достижения консенсуса
Отсутствие механизмов управления: существующие исследования не предлагают простых и эффективных средств управления для направления формирования соглашений

4. Исследовательская мотивация

Вдохновлено двумя направлениями работ:

Исследования игр именования показывают, что соглашения могут возникать из взаимодействия (Ashery et al. 2025)
Структурированные форматы (такие как JSON schema) улучшают рассуждения LLM и сотрудничество в контролируемых задачах (Chen et al. 2024)

Статья ставит ключевой вопрос: Могут ли лёгкие схема-приоры направлять само формирование соглашений?

Основные вклады

Предложена структура SIGN: впервые введены схема-индуцированные механизмы в игры именования, исследуется, как структурированные ограничения влияют на формирование соглашений агентами LLM
Эмпирическая верификация преимуществ структурированной коммуникации:
- Скорость достижения согласованности повышена на порядок (значительное снижение потребления токенов)
- Групповая согласованность повышена до 5,8 раза (с 0,111 до 0,639)
Предоставлен управляемый механизм координации: демонстрируется, что ограничения схемы могут служить модель-независимым "управляющим рычагом", просто и эффективно улучшая многоагентную координацию
Кросс-модельная верификация: метод верифицирован на моделях Phi-3 и LLaMA, а также на их гибридных популяциях
Теоретические insights: раскрыто, как минимальные структурные приоры формируют процесс возникновения соглашений, предоставляя руководство для проектирования многоагентных систем

Подробное описание методологии

Определение задачи

Игра именования определена в следующей постановке:

Популяция: N агентов
Словарь: фиксированный словарь L = {C₁, ..., Cₘ}
Временные раунды: t = 1, ..., T
Механизм взаимодействия: на каждом раунде два агента случайно выбираются в пару
Цель: через взаимодействие привести популяцию к общему соглашению об именовании

Входные данные: агент i на раунде t генерирует сообщение m^t_i

Выходные данные: декодер отображает сообщение на имя в словаре y^t_i ∈ L

Ограничения: каждый агент поддерживает окно памяти размером K, хранящее последние K взаимодействий с партнёром

Три экспериментальных условия

1. Natural Language (NL)

Агенты генерируют неограниченный вывод на естественном языке
Декодер извлекает действительные токены насколько возможно
Нет механизма памяти (K=0)

2. Natural Language Sliding Window (NL-SW)

Расширение условия NL с добавлением окна памяти размером K
Последние взаимодействия влияют на будущие предложения
По-прежнему используется коммуникация на естественном языке

3. Schema (ключевое нововведение)

Принудительный формат: требует ответ в формате @say {name: Ck}
Механизм парсинга: использует регулярные выражения для извлечения токена Ck
Обработка ошибок:
- Несоответствующий вывод получает одну повторную попытку (с напоминанием)
- Если всё ещё неправильно, декодируется свободный текст
- Если полностью не декодируется, устанавливается y ← None
Философия проектирования: предоставляет явные, легко парсируемые дескрипторы словарных записей, сохраняя прозрачность для слушателя с минимальными затратами

Поток алгоритма (Algorithm 1)

Входные данные: N(количество агентов), L(словарь), K(размер памяти), T(раунды), α(вероятность принятия)

для t = 1 до T:
    1. Равномерно случайно выбрать пару агентов i, j
    2. Каждый агент формирует предложение m^t на основе K последних воспоминаний о партнёре
    3. Распарсить @say {name: Ck} → y
    4. если несоответствие:
           повторить с напоминанием один раз
           если всё ещё неправильно:
               декодировать свободный текст
               если не декодируется:
                   y ← None
    5. если y_i ≠ y_j:
           с вероятностью α принять Ck партнёра (механизм lose-shift)

Технические инновации

1. Лёгкий дизайн схемы

Минимизация ограничений: требует только специфический формат метки, не ограничивает выбор содержания
Прозрачность: формат ясен, удобен для парсинга и отладки
Гибкость: сохраняет достаточную свободу для возникновения соглашений

2. Механизм обработки ошибок

Одна повторная попытка избегает чрезмерного наказания
Деградирующая обработка обеспечивает непрерывность эксперимента
Балансирует структурные ограничения с практичностью

3. Партнёр-специфичная память

Записывает только историю взаимодействия с партнёром по взаимодействию
Моделирует локальную информацию в реальных социальных сетях
Снижает сложность памяти

4. Вероятностный механизм принятия

Стратегия lose-shift: при несовпадении с вероятностью α принять выбор партнёра
Параметр α управляет скоростью обучения
Моделирует динамику социального обучения

Экспериментальная установка

Набор данных

Словарь: фиксированные 12 записей (M=12)
Без внешних наборов данных: чистые симуляционные эксперименты, данные генерируются через взаимодействие агентов

Экспериментальные параметры

Параметр	Значение
Размер популяции (N)	12, 24
Размер словаря (M)	12
Всего раундов (T)	300 (100 для смешанных экспериментов)
Окно памяти (K)	0, 5, 10
Вероятность принятия (α)	0.5, 0.75, 0.9/0.99
Случайные семена	3

Конфигурация моделей

Модели основного эксперимента:

Phi-3 Mini 4K Instruct
LLaMA 3.2 3B Instruct

Параметры декодирования (одинаковые для обеих моделей):

max_new_tokens = 32
temperature = 0.7
top_p = 0.9
repeat_penalty = 1.1

Метрики оценки

Групповая согласованность (Population Agreement)
- Определение: доля агентов в популяции, достигших одного и того же имени для конкретного понятия
- Диапазон: 0, 1, выше значение указывает на лучшее формирование соглашения
Токены до сходимости (Tokens-to-Convergence)
- Определение: общее количество токенов, необходимых для достижения определённого порога согласованности (50%, 60%, 70%)
- Ключевая метрика эффективности
Стандартное отклонение
- Измеряет стабильность между различными запусками

Методы сравнения

NL (Baseline 1): неструктурированная, без памяти коммуникация на естественном языке
NL-SW (Baseline 2): коммуникация на естественном языке с окном памяти
Schema (предложенный метод): структурированная коммуникация, индуцированная схемой

Результаты экспериментов

Основные результаты

1. Значительное повышение групповой согласованности (Table 1)

N	K	NL	NL-SW	Schema
12	0	0.111±0.048	—	—
24	0	0.125±0.042	—	—
12	5	—	0.278±0.127	0.611±0.293
24	5	—	0.292±0.042	0.556±0.064
12	10	—	0.333±0.144	0.639±0.096
24	10	—	0.295±0.039	0.588±0.085

Ключевые находки:

При условии Schema согласованность достигает 0.556-0.639, что представляет повышение в 5-5.8 раза по сравнению с NL (0.111-0.125)
Повышение примерно в 2 раза по сравнению с NL-SW (0.278-0.333)
Лучшая производительность при K=10 (0.639), подтверждая важность памяти

2. Влияние различных вероятностей принятия (Figure 1)

α=0.5: Schema достигает 0.6-0.65, NL-SW около 0.3, NL ниже 0.2
α=0.75, 0.9: аналогичные тенденции, но с небольшим снижением
Контринтуитивная находка: более высокие α (более агрессивное принятие) слегка снижают согласованность
Стабильность: Schema при α=0.5 показывает минимальное стандартное отклонение, наиболее согласованные результаты

3. Эффективность токенов (Figure 2)

Токены, необходимые для достижения 50% согласованности:

Schema: примерно 10⁴ порядок
NL-SW: примерно 10⁵ порядок
NL: примерно 10⁵-10⁶ порядок

Улучшение эффективности: Schema быстрее NL/NL-SW на порядок величины

4. Сходимость при высоких порогах (Appendix Figures 5a, 5b)

60% согласованность:

Schema сходится, требуя почти на два порядка меньше токенов, чем NL-SW
NL никогда не достигает этого порога

70% согласованность:

Только Schema достигает сходимости
Требует немного больше токенов, чем для порога 60%

Кросс-модельная верификация

1. Эксперимент только с LLaMA (Figure 3)

Согласованность Schema: 0.75-0.8
NL и NL-SW: 0.65-0.7
Находка: LLaMA в целом превосходит Phi, но преимущество Schema остаётся значительным

2. Эксперимент со смешанными моделями (Figure 4)

6 Phi-3 + 6 LLaMA 3.2
Ограничено 100 раундами
Результат: Schema сохраняет явное преимущество в гетерогенной популяции
Значение: метод устойчив к различиям моделей

Абляционные эксперименты

Хотя явно не обозначены как абляционные, сравнение трёх условий позволяет анализировать вклад каждого фактора:

Роль памяти (NL vs NL-SW)
- Добавление памяти (K=5,10) повышает согласованность с 0.111 до 0.278-0.333
- Повышение примерно в 2.5-3 раза
Роль схемы (NL-SW vs Schema)
- При одинаковых условиях памяти схема повышает согласованность с 0.278-0.333 до 0.556-0.639
- Повышение примерно в 1.7-2 раза
Комбинированный эффект (NL vs Schema)
- Комбинированный эффект памяти+схемы достигает 5-5.8 кратного повышения
- Не простое сложение, существует синергетический эффект

Экспериментальные находки

Структурированные ограничения — ключевой движущий фактор: улучшение, вносимое схемой, превосходит вклад окна памяти
Влияние размера популяции:
- При увеличении N с 12 до 24 согласованность слегка снижается (ожидаемый вызов масштабирования)
- Но Schema сохраняет абсолютное преимущество
Маргинальный эффект окна памяти:
- При увеличении K с 5 до 10 улучшение ограничено (0.611→0.639)
- Указывает, что K=5 уже достаточно для захвата ключевой информации
Немонотонность вероятности принятия:
- α=0.5 показывает лучшую производительность, оспаривая интуицию "более агрессивное обучение лучше"
- Возможная причина: слишком быстрое принятие приводит к локальной блокировке, препятствуя глобальной оптимизации
Различия между семействами моделей:
- LLaMA превосходит Phi в игре именования
- Но обе модели выигрывают от Schema

Связанные работы

1. Многоагентные системы LLM

Guo et al. 2024: обзор многоагентных систем, указывающий на координацию и коммуникацию как основные вызовы
Вклад данной работы: предоставляет конкретный дизайн механизма координации

2. Исследование возникновения соглашений

Baronchelli et al. 2008: классический теоретический анализ игры именования
Ashery et al. 2025: социальные соглашения и коллективные предубеждения в популяциях LLM
Вклад данной работы: введение структурированных ограничений как контрольной переменной, исследование их влияния на процесс возникновения

3. Структурированные форматы и рассуждения LLM

Chen et al. 2024: альтернативные форматы (такие как JSON) улучшают рассуждения и коммуникацию LLM
Вклад данной работы: расширение структурированных форматов от однопроцессных задач к многоагентным сценариям координации

4. Различие от связанных работ

Теория→Практика: применение игры именования от теоретической модели к реальным системам LLM
Пассивное→Активное: не только наблюдение возникновения соглашений, но и активное направление их формирования
Однозадачное→Универсальное: предложенный механизм имеет потенциальную применимость к задачам за пределами именования

Заключение и обсуждение

Основные выводы

Лёгкие схемы эффективно направляют формирование соглашений: фиксированный формат @say {name: Ck} повышает согласованность агентов LLM в игре именования до 5.8 раза
Значительное улучшение эффективности: для достижения одинакового уровня согласованности Schema требует на порядок меньше токенов
Верификация устойчивости: эффект остаётся стабильным в различных моделях (Phi-3, LLaMA), размерах популяции (12, 24) и гетерогенных установках
Мощь минимальных структурных приоров: даже очень простые структурные ограничения значительно формируют процесс возникновения
Практический механизм управления: ограничения схемы предоставляют модель-независимый, легко реализуемый инструмент координации

Ограничения

Ограниченный диапазон задач
- Верифицировано только на игре именования
- Не протестировано на более сложных задачах координации (диалог, планирование)
Малые масштабы экспериментов
- Максимальный размер популяции 24 агента
- Словарь фиксирован на 12 записей
- Реальные приложения могут требовать большие масштабы
Ограниченный выбор моделей
- Протестированы только два семейства моделей (Phi-3, LLaMA)
- Не включены более крупные или продвинутые модели (такие как GPT-4)
Ограничение по раундам
- Основные эксперименты 300 раундов, смешанные эксперименты только 100 раундов
- Может быть недостаточно для наблюдения долгосрочной динамики
Отсутствие теоретического анализа
- Преимущественно эмпирическое исследование
- Не предоставляет глубокого теоретического объяснения, почему Schema эффективна
Потенциальный компромисс гибкости
- Статья упоминает необходимость исследования "может ли согласованность ограничивать более широкие задачи"
- Структурированные ограничения могут пожертвовать выразительностью в некоторых сценариях

Будущие направления

Явно предложенные в статье направления:

Тестирование влияния схемы на вариативность ответов LLM
- Исследование компромисса между согласованностью и разнообразием задач
Эксперименты большего масштаба
- Больше агентов, более крупные словари
Альтернативные дизайны схем
- Исследование эффектов различных структурированных форматов
- Адаптивные или обучаемые схемы
Более длительные экспериментальные периоды
- Наблюдение долгосрочной динамики эволюции
Расширение на другие задачи
- Совместное кодирование, распределённое планирование и другие реальные приложения

Потенциальные направления расширения:

Теоретическое моделирование: построение математической модели, объясняющей, как схемы ускоряют сходимость
Динамические схемы: автоматическая регулировка степени структурированности в зависимости от сложности задачи
Гибридные человеко-машинные системы: тестирование в системах с участием людей
Состязательные установки: исследование производительности структурированных ограничений в конкурентной среде

Глубокая оценка

Преимущества

1. Инновационность методологии

Простота и эффективность: предложенный механизм схемы чрезвычайно лёгкий (только один формат метки), но приносит значительные результаты
Управляемость: предоставляет явный управляющий рычаг (схема да/нет), легко применяемый на практике
Интеграция теории и практики: связывает классическую теорию игры именования с современными системами LLM

2. Достаточность экспериментов

Многомерное сравнение: три условия (NL, NL-SW, Schema) ясно демонстрируют роль каждого фактора
Сканирование параметров: систематическое тестирование различных значений N, K, α
Кросс-модельная верификация: включены однопроцессные и смешанные модельные эксперименты
Анализ с несколькими порогами: анализ сходимости при 50%, 60%, 70% обеспечивает полную перспективу

3. Убедительность результатов

Количественная значимость: 5.8-кратное улучшение, улучшение эффективности на порядок — сильные доказательства
Статистическая стабильность: три случайных семени, отчёты о стандартном отклонении
Согласованные тенденции: все экспериментальные конфигурации показывают преимущество Schema

4. Ясность изложения

Чёткая структура: логический поток от проблемы к методу, экспериментам и выводам
Описание алгоритма: псевдокод лаконичен и понятен
Визуализация: графики эффективно передают основные находки
Обязательство открытого кода: предоставлены ссылки на код, способствуя воспроизводимости

5. Практическая ценность

Низкая стоимость развёртывания: механизм схемы легко реализуется, не требует переобучения модели
Модель-независимость: применим к любому LLM, поддерживающему структурированный вывод
Широкая применимость: принципы расширяются за пределы игры именования на задачи координации

Недостатки

1. Недостаточная теоретическая глубина

Отсутствие объяснения механизма: почему простой формат метки так эффективен? Снижает ли он пространство поиска? Улучшает ли точность парсинга? Или что-то другое?
Отсутствие анализа сходимости: не предоставляются теоретические гарантии (такие как границы скорости сходимости)
Немонотонность α не объяснена: почему α=0.5 лучше, чем α=0.9? Требуется более глубокий анализ

2. Ограничения диапазона экспериментов

Единственная задача: только игра именования, неизвестна обобщаемость
Малые масштабы: N≤24, M=12 может быть недостаточно для реальных приложений
Короткая длительность: 300 раундов может быть недостаточно для наблюдения некоторых долгосрочных явлений (таких как дрейф соглашений)

3. Неполнота сравнений

Отсутствие сравнения других структурированных методов: нет сравнения форматов XML, YAML и т.д.
Отсутствие оптимального базового уровня: не сравнено со специально разработанными протоколами координации (такими как механизмы голосования)
Не протестирована инженерия подсказок: могут ли тщательно разработанные подсказки достичь аналогичных результатов в условии NL?

4. Недостаточно глубокий анализ

Отсутствие анализа ошибок: не детально проанализированы типы и причины несоответствующего вывода
Отсутствие качественного анализа: не показаны примеры фактически генерируемых агентами сообщений
Неисследованное содержание памяти: что хранится в окне памяти? Как это влияет на решения?

5. Недостаточное обсуждение потенциальных негативных последствий

Потеря гибкости: структурированные ограничения могут ограничивать творческие задачи
Распространение ошибок: если ранние соглашения неправильны, схемы могут ускорить их распространение
Справедливость: разные модели могут иметь разные способности адаптации к схемам

6. Неполнота деталей реализации

Неквантифицированное влияние механизма обработки ошибок: конкретное влияние повторных попыток и деградирующей обработки на результаты не измерено
Обоснование параметров декодирования: выбор temperature=0.7 и т.д. не обоснован
Оптимальность стратегии парсинга: является ли равномерное случайное парсинг оптимальным?

Оценка влияния

1. Вклад в область

Методологический вклад: предоставляет новую экспериментальную парадигму для исследований многоагентных LLM
Эмпирический вклад: впервые систематически количественно оценивает влияние структурированных ограничений на формирование соглашений
Вдохновляющее значение: стимулирует дальнейшие исследования "минимально эффективной структуры"

2. Практическая ценность

Немедленная применимость: метод прост, может быть непосредственно применён к существующим системам
Экономическая эффективность: значительное снижение потребления токенов, снижение стоимости вызовов API
Масштабируемость: предоставляет основу для построения крупномасштабных многоагентных систем

3. Воспроизводимость

Высокая: предоставлены репозитории кода, детальные параметры
Открытые модели: использованы открытые модели (Phi-3, LLaMA)
Разумные вычислительные затраты: малые эксперименты, работают на обычных GPU

4. Потенциальные сценарии применения

Совместное кодирование: несколько AI помощников, сотрудничающих в разработке, нуждаются в соглашениях об именовании
Распределённое планирование: многороботные системы, распределение задач и именование
Построение графов знаний: многоагентное совместное аннотирование сущностей и отношений
Многоязычные системы: кросс-языковые агенты, выравнивание концепций

Анализ применимости

Наиболее подходящие сценарии

Ограниченное дискретное пространство выбора: такие как классификация, задачи аннотирования
Требуется быстрая сходимость: приложения в реальном времени или с ограниченными ресурсами
Гетерогенные системы агентов: разные модели требуют единого интерфейса
Предопределяемые форматы: задачи позволяют явную структуру вывода

Менее подходящие сценарии

Открытые творческие задачи: такие как творческое письмо, мозговой штурм
Требуется тонкость: структурированные форматы могут потерять тонкую информацию
Динамически развивающиеся задачи: фиксированные схемы могут ограничить адаптивность
Взаимодействие с людьми: чрезмерная структурированность может повлиять на пользовательский опыт

Сценарии, требующие осторожности

Высокорисковые решения: требуются дополнительные механизмы верификации для предотвращения распространения ошибочных соглашений
Долгосрочные работающие системы: требуется мониторинг дрейфа соглашений и отказа схемы
Кросс-культурные/кросс-доменные приложения: дизайн схемы должен учитывать специфику домена

Библиография

Ключевые цитируемые работы:

Ashery, A. F.; Aiello, L. M.; Baronchelli, A. (2025). Emergent social conventions and collective bias in LLM populations. Science Advances, 11(20): eadu9368.
- Возникновение социальных соглашений в популяциях LLM
Baronchelli, A.; Loreto, V.; Steels, L. (2008). In-depth analysis of the Naming Game dynamics: the homogeneous mixing case. arXiv:0803.0398.
- Классический теоретический анализ игры именования
Chen, W. et al. (2024). Beyond natural language: LLMs leveraging alternative formats for enhanced reasoning and communication. arXiv:2402.18439.
- Структурированные форматы улучшают рассуждения LLM
Guo, T. et al. (2024). Large language model based multi-agents: A survey of progress and challenges. arXiv:2402.01680.
- Обзор многоагентных систем на основе LLM

Резюме

Статья SIGN предлагает простую, но мощную идею: направлять формирование соглашений в многоагентных системах через минимальные структурированные ограничения. Результаты экспериментов впечатляют: 5.8-кратное улучшение согласованности и улучшение эффективности на порядок обеспечивают сильную поддержку для практических приложений.

Основная ценность заключается в предоставлении низкостоимостного, высокоэффективного, модель-независимого механизма координации, что имеет значительное значение в контексте растущей важности многоагентных систем LLM. Простота метода сама по себе является преимуществом — без необходимости сложного обучения или архитектурных модификаций, просто через ограничение формата вывода можно значительно улучшить координацию.

Основные ограничения — это теоретическая глубина и диапазон приложений. Статья больше демонстрирует эмпирически, чем анализирует глубоко; будущие работы должны ответить на вопросы "почему" и "когда". Расширение на более сложные задачи и более крупные масштабы — необходимый следующий шаг.

В целом, это хорошо выполненная исследовательская работа с чёткими вкладами, предоставляющая практические инструменты для многоагентной координации и исследовательские insights, заслуживающая внимания и дальнейшего изучения.