2025-11-23T16:58:15.771567

A framework for the use of generative modelling in non-equilibrium statistical mechanics

Friston, Ramstead, Sakthivadivel

We discuss an approach to mathematically modelling systems made of objects that are coupled together, using generative models of the dependence relationships between states (or trajectories) of the things comprising such systems. This broad class includes open or non-equilibrium systems and is especially relevant to self-organising systems. The ensuing variational free energy principle (FEP) has certain advantages over using random dynamical systems explicitly, notably, by being more tractable and offering a parsimonious explanation of why the joint system evolves in the way that it does, based on the properties of the coupling between system components. The FEP is a method whose use allows us to build a model of the dynamics of an object as if it were a process of variational inference, because variational free energy (or surprisal) is a Lyapunov function for its dynamics. In short, we argue that using generative models to represent and track relations amongst subsystems leads us to a particular statistical theory of interacting systems. Conversely, this theory enables us to construct nested models that respect the known relations amongst subsystems. We point out that the fact that a physical object conforms to the FEP does not necessarily imply that this object performs inference in the literal sense; rather, it is a useful explanatory fiction which replaces the `explicit' dynamics of the object with an `implicit' flow on free energy gradients -- a fiction that may or may not be entertained by the object itself.

academic

Un cadre pour l'utilisation de la modélisation générative en mécanique statistique hors d'équilibre

Informations de base

ID de l'article: 2406.11630
Titre: A framework for the use of generative modelling in non-equilibrium statistical mechanics
Auteurs: Karl J Friston, Maxwell J D Ramstead, Dalton A R Sakthivadivel
Classification: cond-mat.stat-mech math-ph math.MP nlin.AO
Date de publication: 15 octobre 2025
Lien de l'article: https://arxiv.org/abs/2406.11630

Résumé

Cet article traite d'une méthode de modélisation mathématique de systèmes couplés utilisant des modèles génératifs, qui décrivent les dépendances d'états (ou de trajectoires) entre les composants du système. Ces systèmes incluent les systèmes ouverts ou hors d'équilibre, particulièrement adaptés aux systèmes auto-organisés. Le principe de l'énergie libre variationnelle (FEP) qui en résulte présente certains avantages par rapport à l'utilisation explicite de systèmes dynamiques stochastiques, notamment une plus grande maniabilité et la capacité à fournir des explications concises sur la façon dont les systèmes couplés évoluent en fonction de la nature de leurs couplages. Le FEP nous permet de modéliser la dynamique des objets comme un processus d'inférence variationnelle, car l'énergie libre variationnelle (ou surprise) est une fonction de Lyapunov de leur dynamique.

Contexte et motivation de la recherche

Définition du problème

Cette recherche vise à résoudre la question de la modélisation efficace des systèmes physiques couplés, en particulier ceux qui présentent des comportements auto-organisés et adaptatifs hors d'équilibre. Les approches traditionnelles basées sur les systèmes dynamiques stochastiques rencontrent souvent des difficultés mathématiques lors du traitement de relations couplées complexes.

Importance de la recherche

Signification théorique: Fournit un nouveau paradigme de modélisation pour la mécanique statistique, reliant la dynamique des systèmes physiques aux processus d'inférence en théorie de l'information
Valeur pratique: Fournit des outils mathématiques pour comprendre les phénomènes complexes tels que l'auto-organisation biologique et la morphogenèse cellulaire
Impact interdisciplinaire: Relie plusieurs domaines incluant la physique, la théorie de l'information et les sciences cognitives

Limitations des approches existantes

Les méthodes dynamiques stochastiques traditionnelles présentent une complexité computationnelle élevée lors du traitement de systèmes hautement dimensionnels et fortement couplés
Absence d'un cadre théorique unifié pour expliquer le comportement auto-organisé des systèmes
Difficulté à décrire de manière unifiée les processus physiques et les processus de traitement de l'information

Contributions principales

Cadre théorique: Propose un cadre de modélisation unifié basé sur le principe de l'énergie libre variationnelle, décrivant la dynamique des systèmes physiques comme un processus d'inférence variationnelle
Outils mathématiques: Établit les relations de mappage mathématique entre les équations différentielles stochastiques et les flux de gradient d'énergie libre
Clarification philosophique: Distingue clairement la « carte » (modèle scientifique) du « territoire » (système physique réel), évitant les pièges philosophiques de la réification des modèles
Vérification empirique: Valide la théorie par des simulations de morphogenèse cellulaire et de cellules à décharge périodique

Détails méthodologiques

Fondements théoriques

Structure de la couverture de Markov

Considérez une particule avec l'état μ couplée à un environnement avec l'état η par la variable B (de valeur b), avec une densité stationnaire p(η,b,μ) telle que μ soit conditionnellement indépendant de η étant donné B. B est appelé la couverture de Markov du système, incluant généralement les états de perception et les états d'action.

Expression mathématique du principe de l'énergie libre

Pour un système dynamique stochastique avec une densité hors d'équilibre stationnaire:

dXₜ = f(Xₜ)dt + D(Xₜ)dWₜ

Peut être exprimé comme un flux de gradient sur la surprise:

dXₜ = -(Q(Xₜ) - Γ(Xₜ))∇ₓ log p*(Xₜ)dt + D(Xₜ)dWₜ

où Q(x) est antisymétrique partout, Γ(x) est semi-défini positif partout et satisfait 2Γ(x) = D(x)D^T(x).

Définition de l'énergie libre variationnelle

En introduisant la densité conditionnelle q(η; η̂ᵦ), où η̂ᵦ est le mode conditionnel de l'environnement, l'énergie libre variationnelle est définie comme:

F(μ,b) := ∫q(η;σ(μ))log q(η;σ(μ))dη - ∫q(η;σ(μ))log p(η|b)dη - log p(μ,b)

Ceci fournit une borne supérieure de la surprise:

F(μ,b) = D_KL(q(η;σ(μ))||p(η|b)) - log p(μ,b) ≥ -log p(μ,b)

Points d'innovation technique

Description unifiée: Unifie la dynamique physique et l'inférence bayésienne dans le même cadre mathématique
Maniabilité: Évite le calcul direct de distributions conjointes complexes par l'énergie libre variationnelle
Pouvoir explicatif: Fournit une explication théorique de l'information sur la raison pour laquelle les systèmes évoluent de manière particulière

Configuration expérimentale

Modèles de simulation

Modèle de morphogenèse cellulaire

Composition du système: 8 cellules indifférenciées, position initiale identique
Variables d'état: Position physique ψₓ et spectre de signalisation cellulaire ψc
Morphologie cible: Structure tête-corps-queue prédéfinie
Modèle génératif: Utilise la fonction softmax pour mapper l'identité cellulaire aux perceptions attendues

Modèle de cellules à décharge périodique

Description du système: Cellules excitables disposées en anneau, couplées par des jonctions communicantes
Comportement cible: Codage d'une forme d'onde cible périodique
Variables d'état:
- Stimulus externe ηₜ
- État de perception sₜ
- État interne μₜ (phase estimée)
- État d'action aₜ (contrôle des canaux ioniques)

Détails d'implémentation

Utilise la boîte à outils DEM dans MATLAB SPM12 pour les simulations
Emploie l'expansion en série de Taylor des trajectoires en coordonnées généralisées
Paramètres de précision: Π^(1) = e^(-16), Π^(2) = e^(-2)

Résultats expérimentaux

Résultats de morphogenèse cellulaire

Différenciation réussie: Les 8 cellules migrent avec succès de positions initiales identiques vers les positions de morphologie cible
Décroissance de l'énergie libre: Décroissance monotone de l'énergie libre observée au cours de la simulation
Expression de signaux: Les cellules expriment les signaux chimiques correspondants selon leur position dans la morphologie cible

Résultats des cellules à décharge périodique

Cohérence dynamique: Trajectoires hautement cohérentes sous le flux de gradient de surprise (équation 2.1.1) et le flux de gradient d'énergie libre (équation 2.1.3)
Convergence de la divergence KL: Le terme de divergence KL tend vers zéro, validant la minimisation de l'écart d'inférence
Convergence plus rapide: Le flux de gradient d'énergie libre converge plus rapidement et atteint un minimum inférieur par rapport au flux de gradient de surprise

Analyse quantitative

Morphogenèse cellulaire: énergie libre décroît d'environ -240 à environ -340
Modèle de cellules périodiques: divergence KL tendant vers zéro sur une moyenne de 200 échantillons
Coefficient de corrélation proche de 1 entre les deux mécanismes de flux, montrant une excellente cohérence

Travaux connexes

Fondements théoriques

Cette recherche s'appuie sur les fondements théoriques suivants:

Inférence variationnelle: Basée sur la théorie de l'inférence variationnelle bayésienne de Beal et al.
Thermodynamique stochastique: S'inspire des travaux de Seifert et al. sur la mécanique statistique hors d'équilibre
Géométrie de l'information: Utilise les progrès de Da Costa et al. en mécanique bayésienne

Relations avec les travaux existants

Extensibilité: Étend la théorie FEP existante des systèmes de contrôle à la mécanique statistique générale
Unification: Fournit un cadre de modélisation plus unifié que la dynamique stochastique traditionnelle
Praticité: Par rapport à la recherche purement théorique, cet article fournit une vérification par simulation concrète

Conclusions et discussion

Conclusions principales

Le FEP fournit un cadre efficace pour modéliser la dynamique des systèmes physiques comme un processus d'inférence variationnelle
Cette méthode présente des avantages computationnels et une simplicité explicative lors du traitement de systèmes auto-organisés
Le fait que les systèmes physiques suivent le FEP ne signifie pas qu'ils effectuent littéralement une inférence, mais plutôt qu'il s'agit d'un outil interprétatif utile

Limitations

Portée d'application: Principalement applicable aux systèmes possédant une structure de couverture de Markov
Complexité computationnelle: Peut toujours faire face à des défis computationnels dans certains cas hautement dimensionnels
Limitations de vérification: Les vérifications actuelles sont principalement basées sur des simulations, manquant de vérification sur davantage de systèmes physiques réels

Directions futures

Extension à des systèmes hiérarchiques plus complexes
Intégration avec la mécanique quantique
Vérification d'application dans des systèmes biologiques et physiques réels

Évaluation approfondie

Avantages

Innovation théorique: Établit avec succès un pont entre la physique et la théorie de l'information, fournissant un nouveau paradigme de modélisation
Rigueur mathématique: Fournit des dérivations mathématiques complètes, du mappage des équations différentielles stochastiques à l'énergie libre variationnelle
Profondeur philosophique: Analyse en profondeur le problème « carte-territoire », évitant les confusions conceptuelles courantes
Soutien empirique: Valide la théorie par des simulations de deux types différents

Insuffisances

Vérification expérimentale limitée: Repose principalement sur des simulations informatiques, manquant de vérification sur des systèmes physiques réels
Complexité: Le cadre théorique est relativement complexe, ce qui peut limiter sa promotion dans les applications pratiques
Dépendance aux hypothèses: Dépend d'hypothèses telles que la couverture de Markov et l'approximation de Laplace

Impact

Valeur interdisciplinaire: Fournit des outils théoriques unifiés pour la physique, la biologie, les sciences cognitives et autres domaines
Contribution méthodologique: Fournit un nouveau cadre méthodologique pour la modélisation de systèmes complexes
Signification philosophique: Fournit des perspectives philosophiques profondes sur la nature de la modélisation scientifique

Scénarios d'application

Systèmes biologiques: Différenciation cellulaire, réseaux de neurones, écosystèmes et autres phénomènes auto-organisés
Systèmes physiques: Mécanique statistique hors d'équilibre, processus de transition de phase, etc.
Applications d'ingénierie: Systèmes de contrôle adaptatif, robotique, etc.
Sciences cognitives: Traitement de l'information cérébrale, inférence perceptuelle, etc.

Références

Cet article cite une riche bibliographie interdisciplinaire, incluant:

Les travaux antérieurs de Friston et al. sur le principe de l'énergie libre
La théorie des modèles graphiques de Pearl sur les couvertures de Markov
La théorie de la thermodynamique stochastique de Seifert et al.
La perspective théorique de l'information de Jaynes sur la mécanique statistique
Les ouvrages philosophiques de Wittgenstein, notamment le « Tractatus Logico-Philosophicus »

Résumé: Cet article est une contribution théorique importante et interdisciplinaire qui fusionne avec succès la physique et la théorie de l'information, fournissant un nouveau paradigme pour la modélisation de systèmes complexes. Bien que la vérification expérimentale mérite d'être renforcée, son innovation théorique et sa profondeur philosophique en font une contribution majeure dans ce domaine.