Emergent behaviors are a defining feature of complex systems, yet their quantitative characterization remains an open challenge, as traditional classifications rely mainly on visual inspection of spatio-temporal patterns. In this Letter, we propose using the Mean Information Gain (MIG) as a metric to quantify emergence in Agent-Based Models. The MIG is a conditional entropy-based metric that quantifies the lack of information about other elements in a structure given certain known properties. We apply it to a multi-agent biased random walk that reproduces Wolfram's four behavioral classes and show that MIG differentiates these behaviors. This metric reconnects the analysis of emergent behaviors with the classical notions of order, disorder, and entropy, thereby enabling the quantitative classification of regimes as convergent, periodic, complex, and chaotic. This approach overcomes the ambiguity of qualitative inspection near regime boundaries, particularly in large systems, and provides a compact, extensible framework for identifying and comparing emergent behaviors in complex systems.
- 论文ID: 2510.10381
- 标题: Quantifying Emergent Behaviors in Agent-Based Models using Mean Information Gain
- 作者: Sebastián Rodríguez-Falcón (Pontificia Universidad Católica del Perú), Luciano Stucchi (Universidad del Pacífico)
- 分类: physics.soc-ph nlin.AO
- 发表时间: October 14, 2025
- 论文链接: https://arxiv.org/abs/2510.10381
复杂系统中的涌现行为是其定义性特征,但其定量表征仍然是一个开放性挑战,传统分类主要依赖于时空模式的视觉检查。本文提出使用平均信息增益(MIG)作为量化智能体模型中涌现行为的指标。MIG是基于条件熵的度量,用于量化在已知结构某些属性的情况下,对结构中其他元素信息的缺乏程度。作者将其应用于能够重现Wolfram四种行为类别的多智能体有偏随机游走模型,证明MIG能够区分这些行为。该度量将涌现行为分析与经典的有序、无序和熵概念重新连接,从而实现对收敛、周期、复杂和混沌状态的定量分类。
复杂系统研究面临的核心挑战是如何定量表征和分类涌现行为。传统方法主要依赖于视觉检查时空模式,这种定性方法存在主观性和模糊性,特别是在系统边界附近和大规模系统中。
- 理论意义:涌现现象是复杂适应系统的基本特征,存在于生物学(神经和免疫系统)、神经科学(神经网络)、社会科学(社会网络、文化和语言)、系统生态学和经济学等多个学科中
- 实用价值:量化涌现行为对理解和预测复杂系统动态具有重要意义,如鸟群聚集、去中心化经济、进化生态系统等
- 方法论需求:现有研究缺乏通用的定量度量方法,大多数工作依赖于系统特定的指标
- 主观性:基于视觉检查的分类方法缺乏客观性
- 系统特异性:现有度量方法通常针对特定系统设计,缺乏通用性
- 边界模糊:在不同行为状态的边界区域,定性方法难以准确区分
- 提出新的量化框架:引入平均信息增益(MIG)作为量化涌现行为的通用度量指标
- 建立理论联系:将涌现行为分析与经典物理学中的有序、无序和熵概念重新连接
- 验证方法有效性:通过多智能体有偏随机游走模型验证MIG能够有效区分Wolfram的四种行为类别
- 提供定量分类:实现对收敛、周期、复杂和混沌状态的客观定量分类
- 构建可扩展框架:提供紧凑、可扩展的框架用于识别和比较复杂系统中的涌现行为
本研究的任务是开发一种定量方法来区分和分类复杂系统中的不同涌现行为模式,具体包括:
- 输入:多智能体系统的时空配置数据
- 输出:量化的涌现行为度量值
- 目标:客观区分收敛、周期、复杂和混沌四种行为状态
模型在二维离散空间中实现,包含以下核心组件:
- 智能体分布:智能体在房间内随机分布
- 运动规则:两步规则实现有偏运动
- 步骤1:在视野范围内随机选择另一个智能体
- 步骤2:向选中的智能体方向移动一步
- 如果附近没有其他智能体,则随机移动
- 关键参数:
- 视野(Vision):Von Neumann邻域或正交邻域
- 重叠(Superposition):决定智能体是否能够共享同一个单元格
基本定义:
GˉX,Y=−∑x,yP(x,y)log2P(x∣y)
其中:
- X和Y是离散随机变量
- P(x∣y)是给定状态y条件下状态x的条件概率
- P(x,y)是联合概率
应用于多智能体系统:
Gsr,sΔr=−∑sr,sΔrP(sr,sΔr)log2P(sr∣sΔr)
其中:
- sr:参考智能体的状态(0表示未占用,1表示被至少一个智能体占用)
- sΔr:相对于参考智能体位置Δr处的智能体状态
- Δr考虑上、下、左、右四个方向
- 条件熵方法:使用条件熵量化结构中元素间的信息关系,提供了比传统视觉检查更客观的度量
- 空间配置分析:通过分析相邻单元格的占用状态模式,捕获系统的空间有序性
- 多方向集成:综合考虑四个方向的信息增益,提供全面的空间复杂性度量
- 时间平均:通过时间和重复实验的平均,提高度量的稳定性和可靠性
- 平台:NetLogo
- 空间:二维离散网格
- 智能体:随机初始分布
不同行为状态采用不同的实验设置以适应其动态时间尺度:
| 行为状态 | 重复次数 | 时间步数 | 说明 |
|---|
| 收敛状态 | 100 | 20,000 | 需要足够时间让所有智能体完全收敛到单点 |
| 周期状态 | 1000 | 5,000 | 需要时间让智能体聚集并建立持续振荡 |
| 复杂状态 | 100 | 1,000 | 快速达到特征行为 |
| 混沌状态 | 100 | 1,000 | 快速达到特征行为 |
- 位置记录:记录每个时间步所有智能体的位置
- 状态转换:将位置数据转换为二进制占用状态(占用/未占用)
- MIG计算:计算四个方向的MIG值,然后进行时间和重复实验的平均
MIG值按行为状态分类:
| 行为状态 | 平均MIG值 | 标准差 | 特征 |
|---|
| 收敛状态 | 0.1192 | ±0.0024 | 低MIG,高有序性 |
| 周期状态 | 0.135 | ±0.020 | 低MIG,但标准差较大 |
| 复杂状态 | 0.9279 | ±0.0027 | 高MIG,协调运动 |
| 混沌状态 | 0.9776 | ±0.0012 | 最高MIG,无序运动 |
方向性分析:
各行为状态在四个方向(上、下、左、右)上的MIG值基本一致,表明度量的空间对称性。
- 收敛状态:智能体最终收敛到单点,空间重分布最小
- 周期状态:形成振荡聚类,可能形成多个不同方向振荡的聚类,导致标准差较大
- 复杂状态:表现为协调的二维随机游走,智能体集体探索空间
- 混沌状态:缺乏可识别的结构,保持在初始配置附近的局部化运动
通过分析智能体平均位置的轨迹:
- 复杂状态:类似协调的宏观智能体执行二维随机游走
- 混沌状态:缺乏集体协调,保持在起始点附近局部化
- 智能体建模(ABM):专注于理解智能体特征、决策过程或规则变化如何影响系统动态
- 元胞自动机(CA):主要研究局部相互作用产生的大尺度模式
- Wolfram分类:经典的四类行为分类方案(收敛、周期、混沌、复杂)
现有研究大多依赖系统特定的度量指标,缺乏通用的定量方法。本文的MIG方法填补了这一空白,提供了基于信息论的通用框架。
- 有效性验证:MIG成功区分了Wolfram的四种行为类别,提供了客观的定量分类方法
- 理论连接:将涌现行为分析与经典的有序、无序和熵概念重新连接
- 实用框架:提供了可扩展的框架,适用于更大规模系统的涌现行为识别
- 空间分辨率限制:由于模型的空间限制和有限的占用状态(占用/未占用),限制了MIG捕获的空间差异分辨率
- 相似MIG值:复杂和混沌状态、收敛和周期状态的MIG值相对接近,需要额外分析来区分
- 参数敏感性:模型参数(视野、重叠)的设置可能影响行为分类的清晰度
- 连续视野参数:将视野参数从二进制扩展为连续值,实现行为状态间的平滑过渡
- 多层次状态:考虑每个单元格的智能体数量而非简单的占用/未占用状态
- 高维扩展:探索方法在高维空间或替代空间拓扑中的应用
- 实际应用:识别现实世界中展现类似涌现运动的系统
- 方法创新性:首次将MIG系统性地应用于ABM中的涌现行为量化,提供了新的理论视角
- 理论基础扎实:基于信息论和条件熵的方法具有坚实的数学基础
- 实验设计合理:针对不同行为状态的动态时间尺度采用不同的实验设置,体现了科学严谨性
- 结果一致性:四个方向的MIG值一致性验证了方法的稳定性
- 模型简化:使用的玩具模型相对简单,可能无法完全代表复杂现实系统
- 分辨率限制:二进制状态编码限制了方法对细微差异的捕获能力
- 验证范围有限:仅在一个特定的ABM上验证,缺乏在其他复杂系统中的验证
- 理论分析不足:缺乏对MIG与其他复杂性度量关系的深入理论分析
- 学术贡献:为复杂系统研究提供了新的定量工具,可能推动该领域的方法论发展
- 跨学科应用:方法的通用性使其在生物学、社会科学、经济学等多个领域具有应用潜力
- 可复现性:使用NetLogo实现,代码和方法描述清晰,便于复现和扩展
- 复杂系统建模:适用于需要客观量化涌现行为的各类复杂系统研究
- 行为分类:可用于自动化识别和分类不同的系统行为模式
- 系统比较:提供标准化的度量方法,便于不同系统间的行为比较
- 参数优化:可作为目标函数用于复杂系统的参数调优
论文引用了20篇重要文献,涵盖了复杂系统理论、智能体建模、元胞自动机、信息论等多个相关领域的经典和前沿工作,为研究提供了坚实的理论基础。
总体评价:本文提出了一个创新且实用的方法来量化复杂系统中的涌现行为,虽然在模型复杂性和验证范围方面存在一定局限,但其理论贡献和方法论价值显著,为复杂系统研究提供了有价值的新工具。