2025-11-23T16:58:15.771567

A framework for the use of generative modelling in non-equilibrium statistical mechanics

Friston, Ramstead, Sakthivadivel
We discuss an approach to mathematically modelling systems made of objects that are coupled together, using generative models of the dependence relationships between states (or trajectories) of the things comprising such systems. This broad class includes open or non-equilibrium systems and is especially relevant to self-organising systems. The ensuing variational free energy principle (FEP) has certain advantages over using random dynamical systems explicitly, notably, by being more tractable and offering a parsimonious explanation of why the joint system evolves in the way that it does, based on the properties of the coupling between system components. The FEP is a method whose use allows us to build a model of the dynamics of an object as if it were a process of variational inference, because variational free energy (or surprisal) is a Lyapunov function for its dynamics. In short, we argue that using generative models to represent and track relations amongst subsystems leads us to a particular statistical theory of interacting systems. Conversely, this theory enables us to construct nested models that respect the known relations amongst subsystems. We point out that the fact that a physical object conforms to the FEP does not necessarily imply that this object performs inference in the literal sense; rather, it is a useful explanatory fiction which replaces the `explicit' dynamics of the object with an `implicit' flow on free energy gradients -- a fiction that may or may not be entertained by the object itself.
academic

비평형 통계역학에서의 생성 모델링 사용을 위한 프레임워크

기본 정보

  • 논문 ID: 2406.11630
  • 제목: A framework for the use of generative modelling in non-equilibrium statistical mechanics
  • 저자: Karl J Friston, Maxwell J D Ramstead, Dalton A R Sakthivadivel
  • 분류: cond-mat.stat-mech math-ph math.MP nlin.AO
  • 발표 시간: 2025년 10월 15일
  • 논문 링크: https://arxiv.org/abs/2406.11630

초록

본 논문은 생성 모델을 사용하여 결합 시스템을 수학적으로 모델링하는 방법을 논의하며, 이는 시스템 구성 요소 간의 상태(또는 궤적)의 종속성을 생성 모델로 설명합니다. 이러한 시스템에는 개방 시스템 또는 비평형 시스템이 포함되며, 특히 자기조직화 시스템에 적합합니다. 그 결과로 나타나는 변분 자유 에너지 원리(FEP)는 명시적으로 확률 동역학 시스템을 사용하는 것에 비해 특정 장점을 가지며, 특히 더 다루기 쉽고 시스템 구성 요소 간의 결합 특성을 기반으로 결합 시스템의 진화 방식에 대한 간결한 설명을 제공할 수 있습니다. FEP는 변분 자유 에너지(또는 놀라움)가 그 동역학의 리아푸노프 함수이기 때문에 물체의 동역학을 변분 추론 과정으로 모델링할 수 있게 합니다.

연구 배경 및 동기

문제 정의

본 연구는 결합된 물리 시스템, 특히 자기조직화 및 적응 행동을 나타내는 비평형 시스템을 효과적으로 모델링하는 방법을 해결하는 것을 목표로 합니다. 전통적인 확률 동역학 시스템 접근법은 복잡한 결합 관계를 처리할 때 종종 수학적 어려움에 직면합니다.

연구의 중요성

  1. 이론적 의의: 통계역학에 새로운 모델링 패러다임을 제공하여 물리 시스템의 동역학을 정보 이론의 추론 과정과 연결합니다
  2. 실용적 가치: 생물 시스템의 자기조직화, 세포 형태 발생 등 복잡한 현상을 이해하기 위한 수학적 도구를 제공합니다
  3. 학제간 영향: 물리학, 정보 이론, 인지 과학 등 여러 분야를 연결합니다

기존 방법의 한계

  1. 전통적인 확률 동역학 방법은 고차원, 강한 결합 시스템을 처리할 때 계산 복잡도가 높습니다
  2. 시스템의 자기조직화 행동을 설명하는 통일된 이론 프레임워크가 부족합니다
  3. 물리 과정과 정보 처리 과정을 통일된 방식으로 설명하기 어렵습니다

핵심 기여

  1. 이론적 프레임워크: 변분 자유 에너지 원리를 기반으로 한 통일된 모델링 프레임워크를 제안하여 물리 시스템 동역학을 변분 추론 과정으로 설명합니다
  2. 수학적 도구: 확률 미분 방정식에서 자유 에너지 기울기 흐름으로의 수학적 매핑 관계를 확립합니다
  3. 철학적 명확화: "지도"(과학 모델)와 "영역"(실제 물리 시스템)을 명확히 구분하여 모델의 구체화에 대한 철학적 함정을 피합니다
  4. 실증적 검증: 세포 형태 발생 및 주기적 방전 세포의 시뮬레이션을 통해 이론의 유효성을 검증합니다

방법 상세 설명

이론적 기초

마르코프 담요 구조

상태 μ를 가진 입자가 상태 η를 가진 환경과 변수 B(값 b)를 통해 결합되어 있고, μ가 B가 주어졌을 때 η와 조건부 독립인 정상 상태 밀도 p(η,b,μ)가 존재한다고 가정합니다. B를 시스템의 마르코프 담요라고 하며, 일반적으로 감지 상태와 활성 상태를 포함합니다.

자유 에너지 원리의 수학적 표현

비평형 정상 상태 밀도를 가진 확률 동역학 시스템의 경우:

dXₜ = f(Xₜ)dt + D(Xₜ)dWₜ

이는 놀라움에 대한 기울기 흐름으로 표현될 수 있습니다:

dXₜ = -(Q(Xₜ) - Γ(Xₜ))∇ₓ log p*(Xₜ)dt + D(Xₜ)dWₜ

여기서 Q(x)는 어디서나 반대칭이고, Γ(x)는 어디서나 양의 반정치이며 2Γ(x) = D(x)D^T(x)를 만족합니다.

변분 자유 에너지 정의

조건부 밀도 q(η; η̂ᵦ)를 도입합니다. 여기서 η̂ᵦ는 환경의 조건부 모드이고, 변분 자유 에너지는 다음과 같이 정의됩니다:

F(μ,b) := ∫q(η;σ(μ))log q(η;σ(μ))dη - ∫q(η;σ(μ))log p(η|b)dη - log p(μ,b)

이는 놀라움의 상한을 제공합니다:

F(μ,b) = D_KL(q(η;σ(μ))||p(η|b)) - log p(μ,b) ≥ -log p(μ,b)

기술적 혁신점

  1. 통일된 설명: 물리 동역학과 베이즈 추론을 동일한 수학 프레임워크 내에서 통합합니다
  2. 다루기 쉬움: 변분 자유 에너지를 통해 복잡한 결합 분포의 직접 계산을 피합니다
  3. 설명력: 시스템이 특정 방식으로 진화하는 이유에 대한 정보 이론적 설명을 제공합니다

실험 설정

시뮬레이션 모델

세포 형태 발생 모델

  • 시스템 구성: 8개의 미분화 세포, 초기 위치 동일
  • 상태 변수: 물리적 위치 ψₓ 및 세포 신호 프로필 ψc
  • 목표 형태: 미리 설정된 머리-몸-꼬리 구조
  • 생성 모델: 소프트맥스 함수를 사용하여 세포 신원을 예상 감지에 매핑합니다

주기적 방전 세포 모델

  • 시스템 설명: 간격 연결을 통해 결합된 환형 배열의 흥분성 세포
  • 목표 행동: 주기적 목표 파형 인코딩
  • 상태 변수:
    • 외부 자극 ηₜ
    • 감지 상태 sₜ
    • 내부 상태 μₜ(추정 위상)
    • 활성 상태 aₜ(이온 채널 게이팅)

구현 세부 사항

  • MATLAB SPM12 도구 상자의 DEM 도구를 사용하여 시뮬레이션 수행
  • 일반화된 좌표에서 궤적 테일러 전개 채택
  • 정밀도 매개변수 설정: Π^(1) = e^(-16), Π^(2) = e^(-2)

실험 결과

세포 형태 발생 결과

  1. 성공적인 분화: 8개 세포가 동일한 초기 위치에서 목표 형태 위치로 성공적으로 이동
  2. 자유 에너지 감소: 시뮬레이션 과정에서 자유 에너지의 단조 감소 관찰
  3. 신호 발현: 세포는 목표 형태에서의 위치에 따라 해당 화학 신호를 발현합니다

주기적 방전 세포 결과

  1. 동역학 일관성: 놀라움 기울기 흐름(방정식 2.1.1)과 자유 에너지 기울기 흐름(방정식 2.1.3) 하의 궤적이 높은 일관성을 보입니다
  2. KL 발산 수렴: KL 발산 항이 0으로 수렴하여 추론 간격의 최소화를 검증합니다
  3. 더 빠른 수렴: 자유 에너지 기울기 흐름이 놀라움 기울기 흐름보다 더 빠르게 수렴하고 더 낮은 최솟값에 도달합니다

정량적 분석

  • 세포 형태 발생에서 자유 에너지는 약 -240에서 약 -340으로 감소
  • 주기적 세포 모델에서 KL 발산은 200개 샘플의 평균에서 0으로 수렴
  • 두 흐름 메커니즘 하의 상관 계수가 1에 가까워 우수한 일관성을 나타냅니다

관련 연구

이론적 기초

본 연구는 다음의 이론적 기초 위에 구축됩니다:

  1. 변분 추론: Beal 등의 변분 베이즈 추론 이론을 기반으로 합니다
  2. 확률 열역학: Seifert 등의 비평형 통계역학 연구를 참고합니다
  3. 정보 기하학: Da Costa 등의 베이즈 역학 진전을 활용합니다

기존 연구와의 관계

  1. 확장성: 기존 FEP 이론을 제어 시스템에서 일반 통계역학으로 확장합니다
  2. 통일성: 전통적인 확률 동역학보다 더 통일된 모델링 프레임워크를 제공합니다
  3. 실용성: 순수 이론 연구에 비해 구체적인 시뮬레이션 검증을 제공합니다

결론 및 토론

주요 결론

  1. FEP는 물리 시스템의 동역학을 변분 추론 과정으로 모델링하는 효과적인 프레임워크를 제공합니다
  2. 이 방법은 자기조직화 시스템을 처리할 때 계산상의 장점과 설명상의 단순성을 가집니다
  3. 물리 시스템이 FEP를 따른다는 것이 그들이 문자 그대로 추론을 수행한다는 의미는 아니며, 오히려 유용한 설명 도구입니다

한계

  1. 적용 범위: 주로 마르코프 담요 구조를 가진 시스템에 적용 가능합니다
  2. 계산 복잡도: 특정 고차원 경우에도 여전히 계산 문제에 직면할 수 있습니다
  3. 검증 한계: 현재 검증은 주로 시뮬레이션을 기반으로 하며 더 많은 실제 물리 시스템의 검증이 부족합니다

향후 방향

  1. 더 복잡한 계층적 시스템으로 확장
  2. 양자역학과의 결합
  3. 실제 생물 및 물리 시스템에서의 응용 검증

심층 평가

장점

  1. 이론적 혁신: 물리학과 정보 이론 사이의 다리를 성공적으로 구축하여 새로운 모델링 패러다임을 제공합니다
  2. 수학적 엄밀성: 확률 미분 방정식에서 변분 자유 에너지로의 매핑에 대한 완전한 수학적 유도를 제공합니다
  3. 철학적 깊이: "지도-영역" 문제에 대한 심층 철학적 분석을 수행하여 일반적인 개념 혼동을 피합니다
  4. 실증적 지원: 두 가지 다른 유형의 시뮬레이션을 통해 이론의 유효성을 검증합니다

부족한 점

  1. 제한된 실험 검증: 주로 컴퓨터 시뮬레이션에 의존하며 실제 물리 시스템의 검증이 부족합니다
  2. 복잡성: 이론 프레임워크가 상대적으로 복잡하여 실제 응용에서의 확산을 제한할 수 있습니다
  3. 가정 의존성: 마르코프 담요 가정 및 라플라스 근사 등에 의존합니다

영향력

  1. 학제간 가치: 물리학, 생물학, 인지 과학 등 분야에 통일된 이론적 도구를 제공합니다
  2. 방법론적 기여: 복잡한 시스템 모델링을 위한 새로운 방법론적 프레임워크를 제공합니다
  3. 철학적 의의: 과학 모델링의 본질에 대한 깊은 철학적 통찰을 제공합니다

적용 가능 분야

  1. 생물 시스템: 세포 분화, 신경망, 생태계 등의 자기조직화 현상
  2. 물리 시스템: 비평형 통계역학, 상전이 과정 등
  3. 공학 응용: 자적응 제어 시스템, 로봇 공학 등
  4. 인지 과학: 뇌 정보 처리, 감각 추론 등

참고 문헌

본 논문은 풍부한 학제간 문헌을 인용하며, 다음을 포함합니다:

  • Friston 등의 자유 에너지 원리에 관한 초기 연구
  • Pearl의 마르코프 담요에 관한 그래프 모델 이론
  • Seifert 등의 확률 열역학 이론
  • Jaynes의 통계역학에 관한 정보 이론적 관점
  • Wittgenstein의 철학 저작 《논리-철학 논고》

요약: 이는 물리학과 정보 이론을 성공적으로 결합하여 복잡한 시스템 모델링을 위한 새로운 패러다임을 제공하는 중요한 이론적 가치를 가진 학제간 논문입니다. 실험 검증 측면에서 개선의 여지가 있지만, 그 이론적 혁신과 철학적 깊이는 이 분야에 대한 중요한 기여를 만듭니다.