2025-11-12T22:07:10.565412

Quantifying Emergent Behaviors in Agent-Based Models using Mean Information Gain

RodrÃguez-FalcÃ³n, Stucchi

Emergent behaviors are a defining feature of complex systems, yet their quantitative characterization remains an open challenge, as traditional classifications rely mainly on visual inspection of spatio-temporal patterns. In this Letter, we propose using the Mean Information Gain (MIG) as a metric to quantify emergence in Agent-Based Models. The MIG is a conditional entropy-based metric that quantifies the lack of information about other elements in a structure given certain known properties. We apply it to a multi-agent biased random walk that reproduces Wolfram's four behavioral classes and show that MIG differentiates these behaviors. This metric reconnects the analysis of emergent behaviors with the classical notions of order, disorder, and entropy, thereby enabling the quantitative classification of regimes as convergent, periodic, complex, and chaotic. This approach overcomes the ambiguity of qualitative inspection near regime boundaries, particularly in large systems, and provides a compact, extensible framework for identifying and comparing emergent behaviors in complex systems.

academic

Quantifying Emergent Behaviors in Agent-Based Models using Mean Information Gain

基本信息

论文ID: 2510.10381
标题: Quantifying Emergent Behaviors in Agent-Based Models using Mean Information Gain
作者: Sebastián Rodríguez-Falcón (Pontificia Universidad Católica del Perú), Luciano Stucchi (Universidad del Pacífico)
分类: physics.soc-ph nlin.AO
发表时间: October 14, 2025
论文链接: https://arxiv.org/abs/2510.10381

理论意义：涌现现象是复杂适应系统的基本特征，存在于生物学（神经和免疫系统）、神经科学（神经网络）、社会科学（社会网络、文化和语言）、系统生态学和经济学等多个学科中
实用价值：量化涌现行为对理解和预测复杂系统动态具有重要意义，如鸟群聚集、去中心化经济、进化生态系统等
方法论需求：现有研究缺乏通用的定量度量方法，大多数工作依赖于系统特定的指标

现有方法局限性

主观性：基于视觉检查的分类方法缺乏客观性
系统特异性：现有度量方法通常针对特定系统设计，缺乏通用性
边界模糊：在不同行为状态的边界区域，定性方法难以准确区分

核心贡献

提出新的量化框架：引入平均信息增益（MIG）作为量化涌现行为的通用度量指标
建立理论联系：将涌现行为分析与经典物理学中的有序、无序和熵概念重新连接
验证方法有效性：通过多智能体有偏随机游走模型验证MIG能够有效区分Wolfram的四种行为类别
提供定量分类：实现对收敛、周期、复杂和混沌状态的客观定量分类
构建可扩展框架：提供紧凑、可扩展的框架用于识别和比较复杂系统中的涌现行为

方法详解

任务定义

本研究的任务是开发一种定量方法来区分和分类复杂系统中的不同涌现行为模式，具体包括：

输入：多智能体系统的时空配置数据
输出：量化的涌现行为度量值
目标：客观区分收敛、周期、复杂和混沌四种行为状态

模型架构

多智能体有偏随机游走模型

模型在二维离散空间中实现，包含以下核心组件：

智能体分布：智能体在房间内随机分布
运动规则：两步规则实现有偏运动
- 步骤1：在视野范围内随机选择另一个智能体
- 步骤2：向选中的智能体方向移动一步
- 如果附近没有其他智能体，则随机移动
关键参数：
- 视野（Vision）：Von Neumann邻域或正交邻域
- 重叠（Superposition）：决定智能体是否能够共享同一个单元格

平均信息增益（MIG）度量

基本定义： $\bar{G}_{X,Y} = -\sum_{x,y} P(x,y) \log_2 P(x|y)$

其中：

$X$ 和 $Y$ 是离散随机变量
$P(x|y)$ 是给定状态 $y$ 条件下状态 $x$ 的条件概率
$P(x,y)$ 是联合概率

应用于多智能体系统： $G_{s_r,s_{\Delta r}} = -\sum_{s_r,s_{\Delta r}} P(s_r, s_{\Delta r}) \log_2 P(s_r|s_{\Delta r})$

其中：

$s_r$ ：参考智能体的状态（0表示未占用，1表示被至少一个智能体占用）
$s_{\Delta r}$ ：相对于参考智能体位置 $\Delta r$ 处的智能体状态
$\Delta r$ 考虑上、下、左、右四个方向

技术创新点

条件熵方法：使用条件熵量化结构中元素间的信息关系，提供了比传统视觉检查更客观的度量
空间配置分析：通过分析相邻单元格的占用状态模式，捕获系统的空间有序性
多方向集成：综合考虑四个方向的信息增益，提供全面的空间复杂性度量
时间平均：通过时间和重复实验的平均，提高度量的稳定性和可靠性

实验设置

模型实现

平台：NetLogo
空间：二维离散网格
智能体：随机初始分布

实验参数

不同行为状态采用不同的实验设置以适应其动态时间尺度：

行为状态	重复次数	时间步数	说明
收敛状态	100	20,000	需要足够时间让所有智能体完全收敛到单点
周期状态	1000	5,000	需要时间让智能体聚集并建立持续振荡
复杂状态	100	1,000	快速达到特征行为
混沌状态	100	1,000	快速达到特征行为

数据收集与处理

位置记录：记录每个时间步所有智能体的位置
状态转换：将位置数据转换为二进制占用状态（占用/未占用）
MIG计算：计算四个方向的MIG值，然后进行时间和重复实验的平均

实验结果

主要结果

MIG值按行为状态分类：

行为状态	平均MIG值	标准差	特征
收敛状态	0.1192	±0.0024	低MIG，高有序性
周期状态	0.135	±0.020	低MIG，但标准差较大
复杂状态	0.9279	±0.0027	高MIG，协调运动
混沌状态	0.9776	±0.0012	最高MIG，无序运动