2025-11-23T16:58:15.771567

A framework for the use of generative modelling in non-equilibrium statistical mechanics

Friston, Ramstead, Sakthivadivel
We discuss an approach to mathematically modelling systems made of objects that are coupled together, using generative models of the dependence relationships between states (or trajectories) of the things comprising such systems. This broad class includes open or non-equilibrium systems and is especially relevant to self-organising systems. The ensuing variational free energy principle (FEP) has certain advantages over using random dynamical systems explicitly, notably, by being more tractable and offering a parsimonious explanation of why the joint system evolves in the way that it does, based on the properties of the coupling between system components. The FEP is a method whose use allows us to build a model of the dynamics of an object as if it were a process of variational inference, because variational free energy (or surprisal) is a Lyapunov function for its dynamics. In short, we argue that using generative models to represent and track relations amongst subsystems leads us to a particular statistical theory of interacting systems. Conversely, this theory enables us to construct nested models that respect the known relations amongst subsystems. We point out that the fact that a physical object conforms to the FEP does not necessarily imply that this object performs inference in the literal sense; rather, it is a useful explanatory fiction which replaces the `explicit' dynamics of the object with an `implicit' flow on free energy gradients -- a fiction that may or may not be entertained by the object itself.
academic

Основы применения генеративного моделирования в неравновесной статистической механике

Основная информация

  • ID статьи: 2406.11630
  • Название: A framework for the use of generative modelling in non-equilibrium statistical mechanics
  • Авторы: Karl J Friston, Maxwell J D Ramstead, Dalton A R Sakthivadivel
  • Классификация: cond-mat.stat-mech math-ph math.MP nlin.AO
  • Дата публикации: 15 октября 2025 г.
  • Ссылка на статью: https://arxiv.org/abs/2406.11630

Аннотация

В данной работе обсуждается метод математического моделирования связанных систем с использованием генеративных моделей, которые описывают зависимости между состояниями (или траекториями) компонентов системы. Такие системы включают открытые или неравновесные системы, особенно применимые к самоорганизующимся системам. Полученный принцип вариационной свободной энергии (ПСЭ) имеет определённые преимущества по сравнению с явным использованием стохастических динамических систем, в частности, большую управляемость и способность предоставлять краткие объяснения эволюции совместной системы на основе характера связи между компонентами. ПСЭ позволяет моделировать динамику объектов как процесс вариационного вывода, поскольку вариационная свободная энергия (или удивление) является функцией Ляпунова для его динамики.

Исследовательский контекст и мотивация

Определение проблемы

Данное исследование направлено на решение проблемы эффективного моделирования связанных физических систем, особенно неравновесных систем, проявляющих самоорганизацию и адаптивное поведение. Традиционные методы стохастической динамики часто сталкиваются с математическими трудностями при работе со сложными связанными отношениями.

Значимость исследования

  1. Теоретическое значение: предоставляет новую парадигму моделирования для статистической механики, связывая динамику физических систем с процессами вывода в теории информации
  2. Практическая ценность: предоставляет математические инструменты для понимания самоорганизации биологических систем, морфогенеза клеток и других сложных явлений
  3. Междисциплинарное влияние: связывает физику, теорию информации, когнитивную науку и другие области

Ограничения существующих методов

  1. Традиционные методы стохастической динамики имеют высокую вычислительную сложность при работе с высокомерными, сильно связанными системами
  2. Отсутствует единая теоретическая основа для объяснения самоорганизующегося поведения систем
  3. Сложность в единообразном описании физических процессов и процессов обработки информации

Основные вклады

  1. Теоретическая основа: предложена единая основа моделирования на основе принципа вариационной свободной энергии, описывающая динамику физических систем как процесс вариационного вывода
  2. Математические инструменты: установлены математические соответствия между стохастическими дифференциальными уравнениями и потоками градиента свободной энергии
  3. Философское уточнение: чётко различены «карта» (научная модель) и «территория» (реальная физическая система), избегая философических ошибок конкретизации модели
  4. Эмпирическая верификация: теория подтверждена моделированием морфогенеза клеток и периодически разряжающихся клеток

Детальное описание методов

Теоретические основы

Структура марковского одеяла

Рассмотрим частицу с состоянием μ, связанную с окружением с состоянием η через переменную B (со значением b), где существует стационарная плотность p(η,b,μ) такая, что μ условно независима от η при условии B. B называется марковским одеялом системы и обычно включает сенсорные и активные состояния.

Математическое выражение принципа свободной энергии

Для стохастической динамической системы с неравновесной стационарной плотностью:

dXₜ = f(Xₜ)dt + D(Xₜ)dWₜ

может быть представлена как поток градиента удивления:

dXₜ = -(Q(Xₜ) - Γ(Xₜ))∇ₓ log p*(Xₜ)dt + D(Xₜ)dWₜ

где Q(x) везде антисимметрична, Γ(x) везде положительно полуопределена и удовлетворяет 2Γ(x) = D(x)D^T(x).

Определение вариационной свободной энергии

Введём условную плотность q(η; η̂ᵦ), где η̂ᵦ — условный режим окружения, вариационная свободная энергия определяется как:

F(μ,b) := ∫q(η;σ(μ))log q(η;σ(μ))dη - ∫q(η;σ(μ))log p(η|b)dη - log p(μ,b)

Это даёт верхнюю границу удивления:

F(μ,b) = D_KL(q(η;σ(μ))||p(η|b)) - log p(μ,b) ≥ -log p(μ,b)

Технические инновации

  1. Единое описание: объединение физической динамики и байесовского вывода в единой математической основе
  2. Управляемость: использование вариационной свободной энергии избегает прямого расчёта сложного совместного распределения
  3. Объяснительная сила: предоставление информационно-теоретического объяснения того, почему система эволюционирует определённым образом

Экспериментальная установка

Модели моделирования

Модель морфогенеза клеток

  • Состав системы: 8 недифференцированных клеток с одинаковым начальным положением
  • Переменные состояния: физическое положение ψₓ и спектр клеточных сигналов ψc
  • Целевая морфология: предустановленная структура голова-туловище-хвост
  • Генеративная модель: использование функции softmax для отображения идентичности клетки на ожидаемое восприятие

Модель периодически разряжающихся клеток

  • Описание системы: кольцевое расположение возбудимых клеток, связанных щелевыми контактами
  • Целевое поведение: кодирование периодической целевой волны
  • Переменные состояния:
    • Внешний стимул ηₜ
    • Сенсорное состояние sₜ
    • Внутреннее состояние μₜ (оценка фазы)
    • Активное состояние aₜ (управление ионными каналами)

Детали реализации

  • Моделирование выполнено с использованием инструмента DEM из набора MATLAB SPM12
  • Применено разложение Тейлора траектории в обобщённых координатах
  • Параметры точности: Π^(1) = e^(-16), Π^(2) = e^(-2)

Результаты экспериментов

Результаты морфогенеза клеток

  1. Успешная дифференциация: 8 клеток успешно мигрировали из одинакового начального положения в целевые позиции морфологии
  2. Снижение свободной энергии: наблюдалось монотонное снижение свободной энергии в процессе моделирования
  3. Экспрессия сигналов: клетки выражали соответствующие химические сигналы в зависимости от их положения в целевой морфологии

Результаты периодически разряжающихся клеток

  1. Согласованность динамики: траектории при потоке градиента удивления (уравнение 2.1.1) и потоке градиента свободной энергии (уравнение 2.1.3) показывают высокую согласованность
  2. Сходимость дивергенции Кульбака-Лейблера: член дивергенции КЛ стремится к нулю, подтверждая минимизацию промежутка вывода
  3. Более быстрая сходимость: поток градиента свободной энергии сходится быстрее, чем поток градиента удивления, и достигает более низкого минимума

Количественный анализ

  • Свободная энергия при морфогенезе клеток снизилась примерно с -240 до -340
  • Дивергенция КЛ в модели периодических клеток стремится к нулю при усреднении по 200 образцам
  • Коэффициент корреляции между двумя механизмами потока близок к 1, демонстрируя отличную согласованность

Связанные работы

Теоретические основы

Данное исследование строится на следующих теоретических основах:

  1. Вариационный вывод: основан на теории вариационного байесовского вывода Beal и др.
  2. Стохастическая термодинамика: заимствует работы Seifert и др. по статистической механике неравновесных состояний
  3. Информационная геометрия: использует достижения Da Costa и др. в байесовской механике

Отношение к существующим работам

  1. Расширение: расширяет существующую теорию ПСЭ с систем управления на общую статистическую механику
  2. Унификация: предоставляет более единую основу моделирования по сравнению с традиционной стохастической динамикой
  3. Практичность: в отличие от чисто теоретических исследований, данная работа предоставляет конкретную верификацию моделирования

Заключение и обсуждение

Основные выводы

  1. ПСЭ предоставляет эффективную основу для моделирования динамики физических систем как процесса вариационного вывода
  2. Этот метод имеет вычислительные преимущества и концептуальную простоту при работе с самоорганизующимися системами
  3. Соответствие физических систем ПСЭ не означает, что они буквально выполняют вывод, а скорее представляет собой полезный интерпретационный инструмент

Ограничения

  1. Область применения: в основном применима к системам с структурой марковского одеяла
  2. Вычислительная сложность: в некоторых высокомерных случаях может по-прежнему сталкиваться с вычислительными проблемами
  3. Ограничения верификации: текущая верификация в основном основана на моделировании, не хватает верификации на более реальных физических системах

Будущие направления

  1. Расширение на более сложные иерархические системы
  2. Интеграция с квантовой механикой
  3. Верификация применения на реальных биологических и физических системах

Глубокая оценка

Преимущества

  1. Теоретическая инновация: успешно построен мост между физикой и теорией информации, предоставлена новая парадигма моделирования
  2. Математическая строгость: предоставлены полные математические выводы, отображение от стохастических дифференциальных уравнений к вариационной свободной энергии
  3. Философская глубина: проведён глубокий философский анализ проблемы «карта-территория», избегнуты распространённые концептуальные ошибки
  4. Эмпирическая поддержка: теория подтверждена двумя различными типами моделирования

Недостатки

  1. Ограниченная экспериментальная верификация: в основном зависит от компьютерного моделирования, не хватает верификации на реальных физических системах
  2. Сложность: теоретическая основа относительно сложна, что может ограничить её распространение в практических приложениях
  3. Зависимость от предположений: зависит от предположения марковского одеяла и лапласовского приближения и др.

Влияние

  1. Междисциплинарная ценность: предоставляет единый теоретический инструмент для физики, биологии, когнитивной науки и других областей
  2. Методологический вклад: предоставляет новую методологическую основу для моделирования сложных систем
  3. Философское значение: предоставляет глубокое философское понимание природы научного моделирования

Применимые сценарии

  1. Биологические системы: клеточная дифференциация, нейронные сети, экосистемы и другие явления самоорганизации
  2. Физические системы: статистическая механика неравновесных состояний, фазовые переходы и др.
  3. Инженерные приложения: адаптивные системы управления, робототехника и др.
  4. Когнитивная наука: обработка информации мозгом, восприятие и вывод и др.

Библиография

В работе цитируется богатая междисциплинарная литература, включая:

  • Ранние работы Friston и др. по принципу свободной энергии
  • Теория графических моделей Pearl о марковском одеяле
  • Теория стохастической термодинамики Seifert и др.
  • Информационно-теоретический взгляд Jaynes на статистическую механику
  • Философские работы Wittgenstein «Логико-философский трактат»

Резюме: Это статья с важной теоретической ценностью, успешно объединяющая физику и теорию информации, предоставляющая новую парадигму для моделирования сложных систем. Хотя экспериментальная верификация требует дальнейшего развития, её теоретическая инновация и философская глубина делают её значительным вкладом в данную область.