2025-11-23T16:58:15.771567

A framework for the use of generative modelling in non-equilibrium statistical mechanics

Friston, Ramstead, Sakthivadivel
We discuss an approach to mathematically modelling systems made of objects that are coupled together, using generative models of the dependence relationships between states (or trajectories) of the things comprising such systems. This broad class includes open or non-equilibrium systems and is especially relevant to self-organising systems. The ensuing variational free energy principle (FEP) has certain advantages over using random dynamical systems explicitly, notably, by being more tractable and offering a parsimonious explanation of why the joint system evolves in the way that it does, based on the properties of the coupling between system components. The FEP is a method whose use allows us to build a model of the dynamics of an object as if it were a process of variational inference, because variational free energy (or surprisal) is a Lyapunov function for its dynamics. In short, we argue that using generative models to represent and track relations amongst subsystems leads us to a particular statistical theory of interacting systems. Conversely, this theory enables us to construct nested models that respect the known relations amongst subsystems. We point out that the fact that a physical object conforms to the FEP does not necessarily imply that this object performs inference in the literal sense; rather, it is a useful explanatory fiction which replaces the `explicit' dynamics of the object with an `implicit' flow on free energy gradients -- a fiction that may or may not be entertained by the object itself.
academic

Un cadre pour l'utilisation de la modélisation générative en mécanique statistique hors d'équilibre

Informations de base

  • ID de l'article: 2406.11630
  • Titre: A framework for the use of generative modelling in non-equilibrium statistical mechanics
  • Auteurs: Karl J Friston, Maxwell J D Ramstead, Dalton A R Sakthivadivel
  • Classification: cond-mat.stat-mech math-ph math.MP nlin.AO
  • Date de publication: 15 octobre 2025
  • Lien de l'article: https://arxiv.org/abs/2406.11630

Résumé

Cet article traite d'une méthode de modélisation mathématique de systèmes couplés utilisant des modèles génératifs, qui décrivent les dépendances d'états (ou de trajectoires) entre les composants du système. Ces systèmes incluent les systèmes ouverts ou hors d'équilibre, particulièrement adaptés aux systèmes auto-organisés. Le principe de l'énergie libre variationnelle (FEP) qui en résulte présente certains avantages par rapport à l'utilisation explicite de systèmes dynamiques stochastiques, notamment une plus grande maniabilité et la capacité à fournir des explications concises sur la façon dont les systèmes couplés évoluent en fonction de la nature de leurs couplages. Le FEP nous permet de modéliser la dynamique des objets comme un processus d'inférence variationnelle, car l'énergie libre variationnelle (ou surprise) est une fonction de Lyapunov de leur dynamique.

Contexte et motivation de la recherche

Définition du problème

Cette recherche vise à résoudre la question de la modélisation efficace des systèmes physiques couplés, en particulier ceux qui présentent des comportements auto-organisés et adaptatifs hors d'équilibre. Les approches traditionnelles basées sur les systèmes dynamiques stochastiques rencontrent souvent des difficultés mathématiques lors du traitement de relations couplées complexes.

Importance de la recherche

  1. Signification théorique: Fournit un nouveau paradigme de modélisation pour la mécanique statistique, reliant la dynamique des systèmes physiques aux processus d'inférence en théorie de l'information
  2. Valeur pratique: Fournit des outils mathématiques pour comprendre les phénomènes complexes tels que l'auto-organisation biologique et la morphogenèse cellulaire
  3. Impact interdisciplinaire: Relie plusieurs domaines incluant la physique, la théorie de l'information et les sciences cognitives

Limitations des approches existantes

  1. Les méthodes dynamiques stochastiques traditionnelles présentent une complexité computationnelle élevée lors du traitement de systèmes hautement dimensionnels et fortement couplés
  2. Absence d'un cadre théorique unifié pour expliquer le comportement auto-organisé des systèmes
  3. Difficulté à décrire de manière unifiée les processus physiques et les processus de traitement de l'information

Contributions principales

  1. Cadre théorique: Propose un cadre de modélisation unifié basé sur le principe de l'énergie libre variationnelle, décrivant la dynamique des systèmes physiques comme un processus d'inférence variationnelle
  2. Outils mathématiques: Établit les relations de mappage mathématique entre les équations différentielles stochastiques et les flux de gradient d'énergie libre
  3. Clarification philosophique: Distingue clairement la « carte » (modèle scientifique) du « territoire » (système physique réel), évitant les pièges philosophiques de la réification des modèles
  4. Vérification empirique: Valide la théorie par des simulations de morphogenèse cellulaire et de cellules à décharge périodique

Détails méthodologiques

Fondements théoriques

Structure de la couverture de Markov

Considérez une particule avec l'état μ couplée à un environnement avec l'état η par la variable B (de valeur b), avec une densité stationnaire p(η,b,μ) telle que μ soit conditionnellement indépendant de η étant donné B. B est appelé la couverture de Markov du système, incluant généralement les états de perception et les états d'action.

Expression mathématique du principe de l'énergie libre

Pour un système dynamique stochastique avec une densité hors d'équilibre stationnaire:

dXₜ = f(Xₜ)dt + D(Xₜ)dWₜ

Peut être exprimé comme un flux de gradient sur la surprise:

dXₜ = -(Q(Xₜ) - Γ(Xₜ))∇ₓ log p*(Xₜ)dt + D(Xₜ)dWₜ

où Q(x) est antisymétrique partout, Γ(x) est semi-défini positif partout et satisfait 2Γ(x) = D(x)D^T(x).

Définition de l'énergie libre variationnelle

En introduisant la densité conditionnelle q(η; η̂ᵦ), où η̂ᵦ est le mode conditionnel de l'environnement, l'énergie libre variationnelle est définie comme:

F(μ,b) := ∫q(η;σ(μ))log q(η;σ(μ))dη - ∫q(η;σ(μ))log p(η|b)dη - log p(μ,b)

Ceci fournit une borne supérieure de la surprise:

F(μ,b) = D_KL(q(η;σ(μ))||p(η|b)) - log p(μ,b) ≥ -log p(μ,b)

Points d'innovation technique

  1. Description unifiée: Unifie la dynamique physique et l'inférence bayésienne dans le même cadre mathématique
  2. Maniabilité: Évite le calcul direct de distributions conjointes complexes par l'énergie libre variationnelle
  3. Pouvoir explicatif: Fournit une explication théorique de l'information sur la raison pour laquelle les systèmes évoluent de manière particulière

Configuration expérimentale

Modèles de simulation

Modèle de morphogenèse cellulaire

  • Composition du système: 8 cellules indifférenciées, position initiale identique
  • Variables d'état: Position physique ψₓ et spectre de signalisation cellulaire ψc
  • Morphologie cible: Structure tête-corps-queue prédéfinie
  • Modèle génératif: Utilise la fonction softmax pour mapper l'identité cellulaire aux perceptions attendues

Modèle de cellules à décharge périodique

  • Description du système: Cellules excitables disposées en anneau, couplées par des jonctions communicantes
  • Comportement cible: Codage d'une forme d'onde cible périodique
  • Variables d'état:
    • Stimulus externe ηₜ
    • État de perception sₜ
    • État interne μₜ (phase estimée)
    • État d'action aₜ (contrôle des canaux ioniques)

Détails d'implémentation

  • Utilise la boîte à outils DEM dans MATLAB SPM12 pour les simulations
  • Emploie l'expansion en série de Taylor des trajectoires en coordonnées généralisées
  • Paramètres de précision: Π^(1) = e^(-16), Π^(2) = e^(-2)

Résultats expérimentaux

Résultats de morphogenèse cellulaire

  1. Différenciation réussie: Les 8 cellules migrent avec succès de positions initiales identiques vers les positions de morphologie cible
  2. Décroissance de l'énergie libre: Décroissance monotone de l'énergie libre observée au cours de la simulation
  3. Expression de signaux: Les cellules expriment les signaux chimiques correspondants selon leur position dans la morphologie cible

Résultats des cellules à décharge périodique

  1. Cohérence dynamique: Trajectoires hautement cohérentes sous le flux de gradient de surprise (équation 2.1.1) et le flux de gradient d'énergie libre (équation 2.1.3)
  2. Convergence de la divergence KL: Le terme de divergence KL tend vers zéro, validant la minimisation de l'écart d'inférence
  3. Convergence plus rapide: Le flux de gradient d'énergie libre converge plus rapidement et atteint un minimum inférieur par rapport au flux de gradient de surprise

Analyse quantitative

  • Morphogenèse cellulaire: énergie libre décroît d'environ -240 à environ -340
  • Modèle de cellules périodiques: divergence KL tendant vers zéro sur une moyenne de 200 échantillons
  • Coefficient de corrélation proche de 1 entre les deux mécanismes de flux, montrant une excellente cohérence

Travaux connexes

Fondements théoriques

Cette recherche s'appuie sur les fondements théoriques suivants:

  1. Inférence variationnelle: Basée sur la théorie de l'inférence variationnelle bayésienne de Beal et al.
  2. Thermodynamique stochastique: S'inspire des travaux de Seifert et al. sur la mécanique statistique hors d'équilibre
  3. Géométrie de l'information: Utilise les progrès de Da Costa et al. en mécanique bayésienne

Relations avec les travaux existants

  1. Extensibilité: Étend la théorie FEP existante des systèmes de contrôle à la mécanique statistique générale
  2. Unification: Fournit un cadre de modélisation plus unifié que la dynamique stochastique traditionnelle
  3. Praticité: Par rapport à la recherche purement théorique, cet article fournit une vérification par simulation concrète

Conclusions et discussion

Conclusions principales

  1. Le FEP fournit un cadre efficace pour modéliser la dynamique des systèmes physiques comme un processus d'inférence variationnelle
  2. Cette méthode présente des avantages computationnels et une simplicité explicative lors du traitement de systèmes auto-organisés
  3. Le fait que les systèmes physiques suivent le FEP ne signifie pas qu'ils effectuent littéralement une inférence, mais plutôt qu'il s'agit d'un outil interprétatif utile

Limitations

  1. Portée d'application: Principalement applicable aux systèmes possédant une structure de couverture de Markov
  2. Complexité computationnelle: Peut toujours faire face à des défis computationnels dans certains cas hautement dimensionnels
  3. Limitations de vérification: Les vérifications actuelles sont principalement basées sur des simulations, manquant de vérification sur davantage de systèmes physiques réels

Directions futures

  1. Extension à des systèmes hiérarchiques plus complexes
  2. Intégration avec la mécanique quantique
  3. Vérification d'application dans des systèmes biologiques et physiques réels

Évaluation approfondie

Avantages

  1. Innovation théorique: Établit avec succès un pont entre la physique et la théorie de l'information, fournissant un nouveau paradigme de modélisation
  2. Rigueur mathématique: Fournit des dérivations mathématiques complètes, du mappage des équations différentielles stochastiques à l'énergie libre variationnelle
  3. Profondeur philosophique: Analyse en profondeur le problème « carte-territoire », évitant les confusions conceptuelles courantes
  4. Soutien empirique: Valide la théorie par des simulations de deux types différents

Insuffisances

  1. Vérification expérimentale limitée: Repose principalement sur des simulations informatiques, manquant de vérification sur des systèmes physiques réels
  2. Complexité: Le cadre théorique est relativement complexe, ce qui peut limiter sa promotion dans les applications pratiques
  3. Dépendance aux hypothèses: Dépend d'hypothèses telles que la couverture de Markov et l'approximation de Laplace

Impact

  1. Valeur interdisciplinaire: Fournit des outils théoriques unifiés pour la physique, la biologie, les sciences cognitives et autres domaines
  2. Contribution méthodologique: Fournit un nouveau cadre méthodologique pour la modélisation de systèmes complexes
  3. Signification philosophique: Fournit des perspectives philosophiques profondes sur la nature de la modélisation scientifique

Scénarios d'application

  1. Systèmes biologiques: Différenciation cellulaire, réseaux de neurones, écosystèmes et autres phénomènes auto-organisés
  2. Systèmes physiques: Mécanique statistique hors d'équilibre, processus de transition de phase, etc.
  3. Applications d'ingénierie: Systèmes de contrôle adaptatif, robotique, etc.
  4. Sciences cognitives: Traitement de l'information cérébrale, inférence perceptuelle, etc.

Références

Cet article cite une riche bibliographie interdisciplinaire, incluant:

  • Les travaux antérieurs de Friston et al. sur le principe de l'énergie libre
  • La théorie des modèles graphiques de Pearl sur les couvertures de Markov
  • La théorie de la thermodynamique stochastique de Seifert et al.
  • La perspective théorique de l'information de Jaynes sur la mécanique statistique
  • Les ouvrages philosophiques de Wittgenstein, notamment le « Tractatus Logico-Philosophicus »

Résumé: Cet article est une contribution théorique importante et interdisciplinaire qui fusionne avec succès la physique et la théorie de l'information, fournissant un nouveau paradigme pour la modélisation de systèmes complexes. Bien que la vérification expérimentale mérite d'être renforcée, son innovation théorique et sa profondeur philosophique en font une contribution majeure dans ce domaine.