2025-11-23T16:58:15.771567

A framework for the use of generative modelling in non-equilibrium statistical mechanics

Friston, Ramstead, Sakthivadivel
We discuss an approach to mathematically modelling systems made of objects that are coupled together, using generative models of the dependence relationships between states (or trajectories) of the things comprising such systems. This broad class includes open or non-equilibrium systems and is especially relevant to self-organising systems. The ensuing variational free energy principle (FEP) has certain advantages over using random dynamical systems explicitly, notably, by being more tractable and offering a parsimonious explanation of why the joint system evolves in the way that it does, based on the properties of the coupling between system components. The FEP is a method whose use allows us to build a model of the dynamics of an object as if it were a process of variational inference, because variational free energy (or surprisal) is a Lyapunov function for its dynamics. In short, we argue that using generative models to represent and track relations amongst subsystems leads us to a particular statistical theory of interacting systems. Conversely, this theory enables us to construct nested models that respect the known relations amongst subsystems. We point out that the fact that a physical object conforms to the FEP does not necessarily imply that this object performs inference in the literal sense; rather, it is a useful explanatory fiction which replaces the `explicit' dynamics of the object with an `implicit' flow on free energy gradients -- a fiction that may or may not be entertained by the object itself.
academic

A framework for the use of generative modelling in non-equilibrium statistical mechanics

基本信息

  • 论文ID: 2406.11630
  • 标题: A framework for the use of generative modelling in non-equilibrium statistical mechanics
  • 作者: Karl J Friston, Maxwell J D Ramstead, Dalton A R Sakthivadivel
  • 分类: cond-mat.stat-mech math-ph math.MP nlin.AO
  • 发表时间: 2025年10月15日
  • 论文链接: https://arxiv.org/abs/2406.11630

摘要

本文讨论了一种使用生成模型对耦合系统进行数学建模的方法,该方法通过生成模型描述系统组成部分之间状态(或轨迹)的依赖关系。这类系统包括开放系统或非平衡系统,特别适用于自组织系统。由此产生的变分自由能原理(FEP)相比于显式使用随机动力学系统具有某些优势,特别是更易处理且能基于系统组件间的耦合性质,对联合系统的演化方式提供简洁的解释。FEP允许我们将物体的动力学建模为变分推理过程,因为变分自由能(或惊讶度)是其动力学的李雅普诺夫函数。

研究背景与动机

问题定义

本研究旨在解决如何有效建模耦合物理系统的问题,特别是那些表现出自组织和适应性行为的非平衡系统。传统的随机动力学系统方法在处理复杂的耦合关系时往往面临数学上的困难。

研究重要性

  1. 理论意义: 为统计力学提供了新的建模范式,将物理系统的动力学与信息论中的推理过程联系起来
  2. 实用价值: 为理解生物系统的自组织、细胞形态发生等复杂现象提供了数学工具
  3. 跨学科影响: 连接了物理学、信息论、认知科学等多个领域

现有方法局限性

  1. 传统随机动力学方法在处理高维、强耦合系统时计算复杂度高
  2. 缺乏统一的理论框架来解释系统的自组织行为
  3. 难以将物理过程与信息处理过程统一描述

核心贡献

  1. 理论框架: 提出了基于变分自由能原理的统一建模框架,将物理系统动力学描述为变分推理过程
  2. 数学工具: 建立了从随机微分方程到自由能梯度流的数学映射关系
  3. 哲学澄清: 明确区分了"地图"(科学模型)与"领域"(真实物理系统),避免了模型具象化的哲学陷阱
  4. 实证验证: 通过细胞形态发生和周期性放电细胞的仿真验证了理论的有效性

方法详解

理论基础

马尔可夫毯结构

考虑一个具有状态μ的粒子与具有状态η的环境通过变量B(值为b)耦合,存在稳态密度p(η,b,μ)使得μ在给定B的条件下与η条件独立。B被称为系统的马尔可夫毯,通常包含感知状态和主动状态。

自由能原理的数学表述

对于具有非平衡稳态密度的随机动力学系统:

dXₜ = f(Xₜ)dt + D(Xₜ)dWₜ

可以表示为惊讶度上的梯度流:

dXₜ = -(Q(Xₜ) - Γ(Xₜ))∇ₓ log p*(Xₜ)dt + D(Xₜ)dWₜ

其中Q(x)处处反对称,Γ(x)处处正半定且满足2Γ(x) = D(x)D^T(x)。

变分自由能定义

引入条件密度q(η; η̂ᵦ),其中η̂ᵦ是环境的条件模式,变分自由能定义为:

F(μ,b) := ∫q(η;σ(μ))log q(η;σ(μ))dη - ∫q(η;σ(μ))log p(η|b)dη - log p(μ,b)

这给出了惊讶度的上界:

F(μ,b) = D_KL(q(η;σ(μ))||p(η|b)) - log p(μ,b) ≥ -log p(μ,b)

技术创新点

  1. 统一描述: 将物理动力学与贝叶斯推理统一在同一数学框架内
  2. 可处理性: 通过变分自由能避免了直接计算复杂的联合分布
  3. 解释力: 提供了系统为何以特定方式演化的信息论解释

实验设置

仿真模型

细胞形态发生模型

  • 系统组成: 8个未分化细胞,初始位置相同
  • 状态变量: 物理位置ψₓ和细胞信号谱ψc
  • 目标形态: 预设的头-身-尾结构
  • 生成模型: 使用softmax函数映射细胞身份到预期感知

周期性放电细胞模型

  • 系统描述: 环形排列的可兴奋细胞,通过缝隙连接耦合
  • 目标行为: 编码周期性目标波形
  • 状态变量:
    • 外部刺激ηₜ
    • 感知状态sₜ
    • 内部状态μₜ(估计相位)
    • 主动状态aₜ(离子通道门控)

实现细节

  • 使用MATLAB SPM12工具箱中的DEM工具进行仿真
  • 采用广义坐标下的轨迹泰勒展开
  • 精度参数设置:Π^(1) = e^(-16), Π^(2) = e^(-2)

实验结果

细胞形态发生结果

  1. 成功分化: 8个细胞从相同初始位置成功迁移到目标形态位置
  2. 自由能下降: 仿真过程中观察到自由能的单调下降
  3. 信号表达: 细胞根据其在目标形态中的位置表达相应的化学信号

周期性放电细胞结果

  1. 动力学一致性: 在惊讶度梯度流(方程2.1.1)和自由能梯度流(方程2.1.3)下的轨迹高度一致
  2. KL散度收敛: KL散度项趋于零,验证了推理间隙的最小化
  3. 更快收敛: 自由能梯度流相比惊讶度梯度流收敛更快且达到更低的最小值

定量分析

  • 细胞形态发生中自由能从约-240下降到约-340
  • 周期性细胞模型中KL散度在200个样本的平均下趋于零
  • 两种流动机制下的相关系数接近1,显示出优秀的一致性

相关工作

理论基础

本研究建立在以下理论基础之上:

  1. 变分推理: 基于Beal等人的变分贝叶斯推理理论
  2. 随机热力学: 借鉴Seifert等人关于非平衡态统计力学的工作
  3. 信息几何: 利用Da Costa等人在贝叶斯力学方面的进展

与现有工作的关系

  1. 扩展性: 将已有的FEP理论从控制系统扩展到一般统计力学
  2. 统一性: 提供了比传统随机动力学更统一的建模框架
  3. 实用性: 相比纯理论研究,本文提供了具体的仿真验证

结论与讨论

主要结论

  1. FEP提供了一个有效的框架,将物理系统的动力学建模为变分推理过程
  2. 该方法在处理自组织系统时具有计算上的优势和解释上的简洁性
  3. 物理系统遵循FEP并不意味着它们在字面意义上执行推理,而是一种有用的解释性工具

局限性

  1. 适用范围: 主要适用于具有马尔可夫毯结构的系统
  2. 计算复杂度: 在某些高维情况下仍可能面临计算挑战
  3. 验证局限: 目前的验证主要基于仿真,缺乏更多实际物理系统的验证

未来方向

  1. 扩展到更复杂的层次化系统
  2. 与量子力学的结合
  3. 在实际生物和物理系统中的应用验证

深度评价

优点

  1. 理论创新: 成功建立了物理学与信息论的桥梁,提供了新的建模范式
  2. 数学严谨: 提供了完整的数学推导,从随机微分方程到变分自由能的映射
  3. 哲学深度: 对"地图-领域"问题进行了深入的哲学分析,避免了常见的概念混淆
  4. 实证支持: 通过两个不同类型的仿真验证了理论的有效性

不足

  1. 实验验证有限: 主要依赖计算机仿真,缺乏真实物理系统的验证
  2. 复杂性: 理论框架相对复杂,可能限制其在实际应用中的推广
  3. 假设依赖: 依赖于马尔可夫毯假设和拉普拉斯近似等

影响力

  1. 跨学科价值: 为物理学、生物学、认知科学等领域提供了统一的理论工具
  2. 方法论贡献: 为复杂系统建模提供了新的方法论框架
  3. 哲学意义: 对科学建模的本质提供了深刻的哲学洞察

适用场景

  1. 生物系统: 细胞分化、神经网络、生态系统等自组织现象
  2. 物理系统: 非平衡态统计力学、相变过程等
  3. 工程应用: 自适应控制系统、机器人学等
  4. 认知科学: 大脑信息处理、感知推理等

参考文献

本文引用了丰富的跨学科文献,包括:

  • Friston等人关于自由能原理的早期工作
  • Pearl关于马尔可夫毯的图模型理论
  • Seifert等人的随机热力学理论
  • Jaynes关于统计力学的信息论观点
  • Wittgenstein的哲学著作《逻辑哲学论》

总结: 这是一篇具有重要理论价值的跨学科论文,成功地将物理学与信息论结合,为复杂系统建模提供了新的范式。尽管在实验验证方面还有待加强,但其理论创新和哲学深度使其成为该领域的重要贡献。