2025-11-23T16:58:15.771567

A framework for the use of generative modelling in non-equilibrium statistical mechanics

Friston, Ramstead, Sakthivadivel

We discuss an approach to mathematically modelling systems made of objects that are coupled together, using generative models of the dependence relationships between states (or trajectories) of the things comprising such systems. This broad class includes open or non-equilibrium systems and is especially relevant to self-organising systems. The ensuing variational free energy principle (FEP) has certain advantages over using random dynamical systems explicitly, notably, by being more tractable and offering a parsimonious explanation of why the joint system evolves in the way that it does, based on the properties of the coupling between system components. The FEP is a method whose use allows us to build a model of the dynamics of an object as if it were a process of variational inference, because variational free energy (or surprisal) is a Lyapunov function for its dynamics. In short, we argue that using generative models to represent and track relations amongst subsystems leads us to a particular statistical theory of interacting systems. Conversely, this theory enables us to construct nested models that respect the known relations amongst subsystems. We point out that the fact that a physical object conforms to the FEP does not necessarily imply that this object performs inference in the literal sense; rather, it is a useful explanatory fiction which replaces the `explicit' dynamics of the object with an `implicit' flow on free energy gradients -- a fiction that may or may not be entertained by the object itself.

academic

A framework for the use of generative modelling in non-equilibrium statistical mechanics

基本信息

论文ID: 2406.11630
标题: A framework for the use of generative modelling in non-equilibrium statistical mechanics
作者: Karl J Friston, Maxwell J D Ramstead, Dalton A R Sakthivadivel
分类: cond-mat.stat-mech math-ph math.MP nlin.AO
发表时间: 2025年10月15日
论文链接: https://arxiv.org/abs/2406.11630

理论意义: 为统计力学提供了新的建模范式，将物理系统的动力学与信息论中的推理过程联系起来
实用价值: 为理解生物系统的自组织、细胞形态发生等复杂现象提供了数学工具
跨学科影响: 连接了物理学、信息论、认知科学等多个领域

现有方法局限性

传统随机动力学方法在处理高维、强耦合系统时计算复杂度高
缺乏统一的理论框架来解释系统的自组织行为
难以将物理过程与信息处理过程统一描述

核心贡献

理论框架: 提出了基于变分自由能原理的统一建模框架，将物理系统动力学描述为变分推理过程
数学工具: 建立了从随机微分方程到自由能梯度流的数学映射关系
哲学澄清: 明确区分了"地图"（科学模型）与"领域"（真实物理系统），避免了模型具象化的哲学陷阱
实证验证: 通过细胞形态发生和周期性放电细胞的仿真验证了理论的有效性

dXₜ = f(Xₜ)dt + D(Xₜ)dWₜ

可以表示为惊讶度上的梯度流：

dXₜ = -(Q(Xₜ) - Γ(Xₜ))∇ₓ log p*(Xₜ)dt + D(Xₜ)dWₜ

其中Q(x)处处反对称，Γ(x)处处正半定且满足2Γ(x) = D(x)D^T(x)。

变分自由能定义

引入条件密度q(η; η̂ᵦ)，其中η̂ᵦ是环境的条件模式，变分自由能定义为：

F(μ,b) := ∫q(η;σ(μ))log q(η;σ(μ))dη - ∫q(η;σ(μ))log p(η|b)dη - log p(μ,b)

这给出了惊讶度的上界：

F(μ,b) = D_KL(q(η;σ(μ))||p(η|b)) - log p(μ,b) ≥ -log p(μ,b)

技术创新点

统一描述: 将物理动力学与贝叶斯推理统一在同一数学框架内
可处理性: 通过变分自由能避免了直接计算复杂的联合分布
解释力: 提供了系统为何以特定方式演化的信息论解释

系统组成: 8个未分化细胞，初始位置相同
状态变量: 物理位置ψₓ和细胞信号谱ψc
目标形态: 预设的头-身-尾结构
生成模型: 使用softmax函数映射细胞身份到预期感知

周期性放电细胞模型

系统描述: 环形排列的可兴奋细胞，通过缝隙连接耦合
目标行为: 编码周期性目标波形
状态变量:
- 外部刺激ηₜ
- 感知状态sₜ
- 内部状态μₜ（估计相位）
- 主动状态aₜ（离子通道门控）

实现细节

使用MATLAB SPM12工具箱中的DEM工具进行仿真
采用广义坐标下的轨迹泰勒展开
精度参数设置：Π^(1) = e^(-16), Π^(2) = e^(-2)

实验结果

细胞形态发生结果

成功分化: 8个细胞从相同初始位置成功迁移到目标形态位置
自由能下降: 仿真过程中观察到自由能的单调下降
信号表达: 细胞根据其在目标形态中的位置表达相应的化学信号

周期性放电细胞结果

动力学一致性: 在惊讶度梯度流（方程2.1.1）和自由能梯度流（方程2.1.3）下的轨迹高度一致
KL散度收敛: KL散度项趋于零，验证了推理间隙的最小化
更快收敛: 自由能梯度流相比惊讶度梯度流收敛更快且达到更低的最小值

定量分析

细胞形态发生中自由能从约-240下降到约-340
周期性细胞模型中KL散度在200个样本的平均下趋于零
两种流动机制下的相关系数接近1，显示出优秀的一致性

结论与讨论

主要结论

FEP提供了一个有效的框架，将物理系统的动力学建模为变分推理过程
该方法在处理自组织系统时具有计算上的优势和解释上的简洁性
物理系统遵循FEP并不意味着它们在字面意义上执行推理，而是一种有用的解释性工具

局限性

适用范围: 主要适用于具有马尔可夫毯结构的系统
计算复杂度: 在某些高维情况下仍可能面临计算挑战
验证局限: 目前的验证主要基于仿真，缺乏更多实际物理系统的验证

未来方向

扩展到更复杂的层次化系统
与量子力学的结合
在实际生物和物理系统中的应用验证

深度评价

优点

理论创新: 成功建立了物理学与信息论的桥梁，提供了新的建模范式
数学严谨: 提供了完整的数学推导，从随机微分方程到变分自由能的映射
哲学深度: 对"地图-领域"问题进行了深入的哲学分析，避免了常见的概念混淆
实证支持: 通过两个不同类型的仿真验证了理论的有效性

不足

实验验证有限: 主要依赖计算机仿真，缺乏真实物理系统的验证
复杂性: 理论框架相对复杂，可能限制其在实际应用中的推广
假设依赖: 依赖于马尔可夫毯假设和拉普拉斯近似等

影响力

跨学科价值: 为物理学、生物学、认知科学等领域提供了统一的理论工具
方法论贡献: 为复杂系统建模提供了新的方法论框架
哲学意义: 对科学建模的本质提供了深刻的哲学洞察

适用场景

生物系统: 细胞分化、神经网络、生态系统等自组织现象
物理系统: 非平衡态统计力学、相变过程等
工程应用: 自适应控制系统、机器人学等
认知科学: 大脑信息处理、感知推理等

参考文献

本文引用了丰富的跨学科文献，包括：

Friston等人关于自由能原理的早期工作
Pearl关于马尔可夫毯的图模型理论
Seifert等人的随机热力学理论
Jaynes关于统计力学的信息论观点
Wittgenstein的哲学著作《逻辑哲学论》

总结: 这是一篇具有重要理论价值的跨学科论文，成功地将物理学与信息论结合，为复杂系统建模提供了新的范式。尽管在实验验证方面还有待加强，但其理论创新和哲学深度使其成为该领域的重要贡献。

A framework for the use of generative modelling in non-equilibrium statistical mechanics

A framework for the use of generative modelling in non-equilibrium statistical mechanics

基本信息

摘要

研究背景与动机

问题定义

研究重要性

现有方法局限性

核心贡献

方法详解

理论基础

马尔可夫毯结构

自由能原理的数学表述

变分自由能定义

技术创新点

实验设置

仿真模型

细胞形态发生模型

周期性放电细胞模型

实现细节

实验结果

细胞形态发生结果

周期性放电细胞结果

定量分析

相关工作

理论基础

与现有工作的关系

结论与讨论

主要结论

局限性

未来方向

深度评价

优点

不足

影响力

适用场景

参考文献