A framework for the use of generative modelling in non-equilibrium statistical mechanics
Friston, Ramstead, Sakthivadivel
We discuss an approach to mathematically modelling systems made of objects that are coupled together, using generative models of the dependence relationships between states (or trajectories) of the things comprising such systems. This broad class includes open or non-equilibrium systems and is especially relevant to self-organising systems. The ensuing variational free energy principle (FEP) has certain advantages over using random dynamical systems explicitly, notably, by being more tractable and offering a parsimonious explanation of why the joint system evolves in the way that it does, based on the properties of the coupling between system components. The FEP is a method whose use allows us to build a model of the dynamics of an object as if it were a process of variational inference, because variational free energy (or surprisal) is a Lyapunov function for its dynamics. In short, we argue that using generative models to represent and track relations amongst subsystems leads us to a particular statistical theory of interacting systems. Conversely, this theory enables us to construct nested models that respect the known relations amongst subsystems. We point out that the fact that a physical object conforms to the FEP does not necessarily imply that this object performs inference in the literal sense; rather, it is a useful explanatory fiction which replaces the `explicit' dynamics of the object with an `implicit' flow on free energy gradients -- a fiction that may or may not be entertained by the object itself.
academic
Un cadre pour l'utilisation de la modélisation générative en mécanique statistique hors d'équilibre
Cet article traite d'une méthode de modélisation mathématique de systèmes couplés utilisant des modèles génératifs, qui décrivent les dépendances d'états (ou de trajectoires) entre les composants du système. Ces systèmes incluent les systèmes ouverts ou hors d'équilibre, particulièrement adaptés aux systèmes auto-organisés. Le principe de l'énergie libre variationnelle (FEP) qui en résulte présente certains avantages par rapport à l'utilisation explicite de systèmes dynamiques stochastiques, notamment une plus grande maniabilité et la capacité à fournir des explications concises sur la façon dont les systèmes couplés évoluent en fonction de la nature de leurs couplages. Le FEP nous permet de modéliser la dynamique des objets comme un processus d'inférence variationnelle, car l'énergie libre variationnelle (ou surprise) est une fonction de Lyapunov de leur dynamique.
Cette recherche vise à résoudre la question de la modélisation efficace des systèmes physiques couplés, en particulier ceux qui présentent des comportements auto-organisés et adaptatifs hors d'équilibre. Les approches traditionnelles basées sur les systèmes dynamiques stochastiques rencontrent souvent des difficultés mathématiques lors du traitement de relations couplées complexes.
Signification théorique: Fournit un nouveau paradigme de modélisation pour la mécanique statistique, reliant la dynamique des systèmes physiques aux processus d'inférence en théorie de l'information
Valeur pratique: Fournit des outils mathématiques pour comprendre les phénomènes complexes tels que l'auto-organisation biologique et la morphogenèse cellulaire
Impact interdisciplinaire: Relie plusieurs domaines incluant la physique, la théorie de l'information et les sciences cognitives
Les méthodes dynamiques stochastiques traditionnelles présentent une complexité computationnelle élevée lors du traitement de systèmes hautement dimensionnels et fortement couplés
Absence d'un cadre théorique unifié pour expliquer le comportement auto-organisé des systèmes
Difficulté à décrire de manière unifiée les processus physiques et les processus de traitement de l'information
Cadre théorique: Propose un cadre de modélisation unifié basé sur le principe de l'énergie libre variationnelle, décrivant la dynamique des systèmes physiques comme un processus d'inférence variationnelle
Outils mathématiques: Établit les relations de mappage mathématique entre les équations différentielles stochastiques et les flux de gradient d'énergie libre
Clarification philosophique: Distingue clairement la « carte » (modèle scientifique) du « territoire » (système physique réel), évitant les pièges philosophiques de la réification des modèles
Vérification empirique: Valide la théorie par des simulations de morphogenèse cellulaire et de cellules à décharge périodique
Considérez une particule avec l'état μ couplée à un environnement avec l'état η par la variable B (de valeur b), avec une densité stationnaire p(η,b,μ) telle que μ soit conditionnellement indépendant de η étant donné B. B est appelé la couverture de Markov du système, incluant généralement les états de perception et les états d'action.
En introduisant la densité conditionnelle q(η; η̂ᵦ), où η̂ᵦ est le mode conditionnel de l'environnement, l'énergie libre variationnelle est définie comme:
Cohérence dynamique: Trajectoires hautement cohérentes sous le flux de gradient de surprise (équation 2.1.1) et le flux de gradient d'énergie libre (équation 2.1.3)
Convergence de la divergence KL: Le terme de divergence KL tend vers zéro, validant la minimisation de l'écart d'inférence
Convergence plus rapide: Le flux de gradient d'énergie libre converge plus rapidement et atteint un minimum inférieur par rapport au flux de gradient de surprise
Le FEP fournit un cadre efficace pour modéliser la dynamique des systèmes physiques comme un processus d'inférence variationnelle
Cette méthode présente des avantages computationnels et une simplicité explicative lors du traitement de systèmes auto-organisés
Le fait que les systèmes physiques suivent le FEP ne signifie pas qu'ils effectuent littéralement une inférence, mais plutôt qu'il s'agit d'un outil interprétatif utile
Portée d'application: Principalement applicable aux systèmes possédant une structure de couverture de Markov
Complexité computationnelle: Peut toujours faire face à des défis computationnels dans certains cas hautement dimensionnels
Limitations de vérification: Les vérifications actuelles sont principalement basées sur des simulations, manquant de vérification sur davantage de systèmes physiques réels
Innovation théorique: Établit avec succès un pont entre la physique et la théorie de l'information, fournissant un nouveau paradigme de modélisation
Rigueur mathématique: Fournit des dérivations mathématiques complètes, du mappage des équations différentielles stochastiques à l'énergie libre variationnelle
Profondeur philosophique: Analyse en profondeur le problème « carte-territoire », évitant les confusions conceptuelles courantes
Soutien empirique: Valide la théorie par des simulations de deux types différents
Cet article cite une riche bibliographie interdisciplinaire, incluant:
Les travaux antérieurs de Friston et al. sur le principe de l'énergie libre
La théorie des modèles graphiques de Pearl sur les couvertures de Markov
La théorie de la thermodynamique stochastique de Seifert et al.
La perspective théorique de l'information de Jaynes sur la mécanique statistique
Les ouvrages philosophiques de Wittgenstein, notamment le « Tractatus Logico-Philosophicus »
Résumé: Cet article est une contribution théorique importante et interdisciplinaire qui fusionne avec succès la physique et la théorie de l'information, fournissant un nouveau paradigme pour la modélisation de systèmes complexes. Bien que la vérification expérimentale mérite d'être renforcée, son innovation théorique et sa profondeur philosophique en font une contribution majeure dans ce domaine.