2025-11-23T16:58:15.771567

A framework for the use of generative modelling in non-equilibrium statistical mechanics

Friston, Ramstead, Sakthivadivel
We discuss an approach to mathematically modelling systems made of objects that are coupled together, using generative models of the dependence relationships between states (or trajectories) of the things comprising such systems. This broad class includes open or non-equilibrium systems and is especially relevant to self-organising systems. The ensuing variational free energy principle (FEP) has certain advantages over using random dynamical systems explicitly, notably, by being more tractable and offering a parsimonious explanation of why the joint system evolves in the way that it does, based on the properties of the coupling between system components. The FEP is a method whose use allows us to build a model of the dynamics of an object as if it were a process of variational inference, because variational free energy (or surprisal) is a Lyapunov function for its dynamics. In short, we argue that using generative models to represent and track relations amongst subsystems leads us to a particular statistical theory of interacting systems. Conversely, this theory enables us to construct nested models that respect the known relations amongst subsystems. We point out that the fact that a physical object conforms to the FEP does not necessarily imply that this object performs inference in the literal sense; rather, it is a useful explanatory fiction which replaces the `explicit' dynamics of the object with an `implicit' flow on free energy gradients -- a fiction that may or may not be entertained by the object itself.
academic

Un marco para el uso de modelado generativo en mecánica estadística de no equilibrio

Información Básica

  • ID del Artículo: 2406.11630
  • Título: Un marco para el uso de modelado generativo en mecánica estadística de no equilibrio
  • Autores: Karl J Friston, Maxwell J D Ramstead, Dalton A R Sakthivadivel
  • Clasificación: cond-mat.stat-mech math-ph math.MP nlin.AO
  • Fecha de Publicación: 15 de octubre de 2025
  • Enlace del Artículo: https://arxiv.org/abs/2406.11630

Resumen

Este artículo analiza un método para modelar matemáticamente sistemas acoplados mediante modelos generativos, que describen las dependencias de estados (o trayectorias) entre componentes del sistema. Tales sistemas incluyen sistemas abiertos o de no equilibrio, particularmente aplicables a sistemas autoorganizados. El principio de energía libre variacional (FEP) resultante presenta ciertas ventajas en comparación con el uso explícito de sistemas dinámicos estocásticos, siendo particularmente más manejable y capaz de proporcionar explicaciones concisas sobre cómo evoluciona el sistema conjunto basándose en la naturaleza del acoplamiento entre componentes. El FEP nos permite modelar la dinámica de objetos como un proceso de inferencia variacional, ya que la energía libre variacional (o sorpresa) es una función de Lyapunov de su dinámica.

Antecedentes de Investigación y Motivación

Definición del Problema

Esta investigación aborda cómo modelar efectivamente sistemas físicos acoplados, particularmente aquellos que exhiben comportamiento autoorganizado y adaptativo en sistemas de no equilibrio. Los enfoques tradicionales de sistemas dinámicos estocásticos frecuentemente enfrentan dificultades matemáticas al tratar relaciones de acoplamiento complejas.

Importancia de la Investigación

  1. Significado Teórico: Proporciona un nuevo paradigma de modelado para la mecánica estadística, vinculando la dinámica de sistemas físicos con procesos de inferencia en teoría de la información
  2. Valor Práctico: Proporciona herramientas matemáticas para comprender fenómenos complejos como la autoorganización biológica y la morfogénesis celular
  3. Impacto Interdisciplinario: Conecta múltiples campos incluyendo física, teoría de la información y ciencias cognitivas

Limitaciones de Métodos Existentes

  1. Los métodos tradicionales de dinámica estocástica presentan alta complejidad computacional al tratar sistemas de alta dimensionalidad y fuerte acoplamiento
  2. Falta un marco teórico unificado para explicar el comportamiento autoorganizado del sistema
  3. Dificultad para describir de manera unificada procesos físicos y procesos de procesamiento de información

Contribuciones Principales

  1. Marco Teórico: Propone un marco de modelado unificado basado en el principio de energía libre variacional, describiendo la dinámica de sistemas físicos como un proceso de inferencia variacional
  2. Herramientas Matemáticas: Establece relaciones de mapeo matemático desde ecuaciones diferenciales estocásticas hasta flujos de gradiente de energía libre
  3. Clarificación Filosófica: Distingue claramente entre "mapa" (modelo científico) y "territorio" (sistema físico real), evitando trampas filosóficas de reificación de modelos
  4. Verificación Empírica: Valida la teoría mediante simulaciones de morfogénesis celular y células de descarga periódica

Explicación Detallada de Métodos

Fundamentos Teóricos

Estructura de Manta de Markov

Considérese una partícula con estado μ acoplada a un ambiente con estado η mediante la variable B (con valor b), existiendo una densidad estacionaria p(η,b,μ) tal que μ es condicionalmente independiente de η dado B. B se denomina manta de Markov del sistema, típicamente incluyendo estados perceptivos y estados activos.

Expresión Matemática del Principio de Energía Libre

Para un sistema dinámico estocástico con densidad de estado estacionario de no equilibrio:

dXₜ = f(Xₜ)dt + D(Xₜ)dWₜ

Puede expresarse como un flujo de gradiente sobre sorpresa:

dXₜ = -(Q(Xₜ) - Γ(Xₜ))∇ₓ log p*(Xₜ)dt + D(Xₜ)dWₜ

donde Q(x) es antisimétrico en todas partes, Γ(x) es semidefinido positivo en todas partes y satisface 2Γ(x) = D(x)D^T(x).

Definición de Energía Libre Variacional

Introduciendo la densidad condicional q(η; η̂ᵦ), donde η̂ᵦ es el patrón condicional del ambiente, la energía libre variacional se define como:

F(μ,b) := ∫q(η;σ(μ))log q(η;σ(μ))dη - ∫q(η;σ(μ))log p(η|b)dη - log p(μ,b)

Esto proporciona un límite superior de sorpresa:

F(μ,b) = D_KL(q(η;σ(μ))||p(η|b)) - log p(μ,b) ≥ -log p(μ,b)

Puntos de Innovación Técnica

  1. Descripción Unificada: Unifica la dinámica física e inferencia bayesiana dentro del mismo marco matemático
  2. Manejabilidad: Evita el cálculo directo de distribuciones conjuntas complejas mediante energía libre variacional
  3. Poder Explicativo: Proporciona una explicación de teoría de la información sobre por qué los sistemas evolucionan de maneras particulares

Configuración Experimental

Modelos de Simulación

Modelo de Morfogénesis Celular

  • Composición del Sistema: 8 células indiferenciadas, posición inicial idéntica
  • Variables de Estado: Posición física ψₓ y espectro de señalización celular ψc
  • Morfología Objetivo: Estructura cabeza-cuerpo-cola predefinida
  • Modelo Generativo: Mapeo de identidad celular a percepciones esperadas mediante función softmax

Modelo de Células de Descarga Periódica

  • Descripción del Sistema: Células excitables en disposición circular, acopladas mediante uniones gap
  • Comportamiento Objetivo: Codificación de forma de onda objetivo periódica
  • Variables de Estado:
    • Estímulo externo ηₜ
    • Estado perceptivo sₜ
    • Estado interno μₜ (fase estimada)
    • Estado activo aₜ (compuerta de canal iónico)

Detalles de Implementación

  • Simulación mediante herramienta DEM en caja de herramientas MATLAB SPM12
  • Expansión de Taylor de trayectoria en coordenadas generalizadas
  • Configuración de parámetros de precisión: Π^(1) = e^(-16), Π^(2) = e^(-2)

Resultados Experimentales

Resultados de Morfogénesis Celular

  1. Diferenciación Exitosa: 8 células migraron exitosamente desde posición inicial idéntica a posiciones de morfología objetivo
  2. Descenso de Energía Libre: Se observó descenso monótono de energía libre durante la simulación
  3. Expresión de Señales: Las células expresaron señales químicas correspondientes según su posición en la morfología objetivo

Resultados de Células de Descarga Periódica

  1. Consistencia Dinámica: Las trayectorias bajo flujo de gradiente de sorpresa (ecuación 2.1.1) y flujo de gradiente de energía libre (ecuación 2.1.3) mostraron alta consistencia
  2. Convergencia de Divergencia KL: El término de divergencia KL tendió a cero, validando la minimización de la brecha de inferencia
  3. Convergencia Más Rápida: El flujo de gradiente de energía libre convergió más rápidamente que el flujo de gradiente de sorpresa y alcanzó valores mínimos más bajos

Análisis Cuantitativo

  • Energía libre en morfogénesis celular descendió de aproximadamente -240 a aproximadamente -340
  • Divergencia KL en modelo de células periódicas tendió a cero en promedio sobre 200 muestras
  • Coeficiente de correlación bajo ambos mecanismos de flujo cercano a 1, demostrando excelente consistencia

Trabajo Relacionado

Fundamentos Teóricos

Esta investigación se construye sobre los siguientes fundamentos teóricos:

  1. Inferencia Variacional: Basada en teoría de inferencia bayesiana variacional de Beal et al.
  2. Termodinámica Estocástica: Inspirada en trabajo de Seifert et al. sobre mecánica estadística de no equilibrio
  3. Geometría de la Información: Utiliza avances de Da Costa et al. en mecánica bayesiana

Relación con Trabajo Existente

  1. Extensibilidad: Extiende teoría FEP existente desde sistemas de control a mecánica estadística general
  2. Unificación: Proporciona marco de modelado más unificado que dinámica estocástica tradicional
  3. Practicidad: En comparación con investigación puramente teórica, proporciona verificación de simulación concreta

Conclusiones y Discusión

Conclusiones Principales

  1. FEP proporciona un marco efectivo para modelar la dinámica de sistemas físicos como un proceso de inferencia variacional
  2. Este método posee ventajas computacionales y simplicidad explicativa al tratar sistemas autoorganizados
  3. El hecho de que sistemas físicos sigan FEP no significa que ejecuten inferencia en sentido literal, sino que es una herramienta interpretativa útil

Limitaciones

  1. Rango de Aplicabilidad: Principalmente aplicable a sistemas con estructura de manta de Markov
  2. Complejidad Computacional: Aún puede enfrentar desafíos computacionales en ciertos casos de alta dimensionalidad
  3. Limitaciones de Verificación: La verificación actual se basa principalmente en simulación, careciendo de verificación en más sistemas físicos reales

Direcciones Futuras

  1. Extensión a sistemas jerárquicos más complejos
  2. Integración con mecánica cuántica
  3. Verificación de aplicación en sistemas biológicos y físicos reales

Evaluación Profunda

Fortalezas

  1. Innovación Teórica: Establece exitosamente un puente entre física e teoría de la información, proporcionando un nuevo paradigma de modelado
  2. Rigor Matemático: Proporciona derivación matemática completa, mapeo desde ecuaciones diferenciales estocásticas a energía libre variacional
  3. Profundidad Filosófica: Realiza análisis filosófico profundo del problema "mapa-territorio", evitando confusiones conceptuales comunes
  4. Apoyo Empírico: Valida la teoría mediante simulaciones de dos tipos diferentes

Insuficiencias

  1. Verificación Experimental Limitada: Depende principalmente de simulación computacional, careciendo de verificación en sistemas físicos reales
  2. Complejidad: El marco teórico es relativamente complejo, lo que puede limitar su promoción en aplicaciones prácticas
  3. Dependencia de Supuestos: Depende de supuestos como la manta de Markov y aproximación de Laplace

Impacto

  1. Valor Interdisciplinario: Proporciona herramienta teórica unificada para física, biología, ciencias cognitivas y otros campos
  2. Contribución Metodológica: Proporciona nuevo marco metodológico para modelado de sistemas complejos
  3. Significado Filosófico: Proporciona perspectiva filosófica profunda sobre la naturaleza del modelado científico

Escenarios de Aplicabilidad

  1. Sistemas Biológicos: Diferenciación celular, redes neuronales, ecosistemas y otros fenómenos autoorganizados
  2. Sistemas Físicos: Mecánica estadística de no equilibrio, procesos de transición de fase
  3. Aplicaciones de Ingeniería: Sistemas de control adaptativo, robótica
  4. Ciencias Cognitivas: Procesamiento de información cerebral, inferencia perceptiva

Referencias

Este artículo cita literatura interdisciplinaria abundante, incluyendo:

  • Trabajo temprano de Friston et al. sobre el principio de energía libre
  • Teoría de modelos gráficos de Pearl sobre mantas de Markov
  • Teoría de termodinámica estocástica de Seifert et al.
  • Perspectiva de teoría de la información de Jaynes sobre mecánica estadística
  • Obra filosófica de Wittgenstein Tractatus Logico-Philosophicus

Resumen: Este es un artículo interdisciplinario de importante valor teórico que integra exitosamente física e teoría de la información, proporcionando un nuevo paradigma para modelado de sistemas complejos. Aunque la verificación experimental requiere fortalecimiento, su innovación teórica y profundidad filosófica lo convierten en una contribución importante en este campo.