2025-11-21T22:52:15.782367

Physically Interpretable World Models via Weakly Supervised Representation Learning

Mao, Umasudhan, Ruchkin

Learning predictive models from high-dimensional sensory observations is fundamental for cyber-physical systems, yet the latent representations learned by standard world models lack physical interpretability. This limits their reliability, generalizability, and applicability to safety-critical tasks. We introduce Physically Interpretable World Models (PIWM), a framework that aligns latent representations with real-world physical quantities and constrains their evolution through partially known physical dynamics. Physical interpretability in PIWM is defined by two complementary properties: (i) the learned latent state corresponds to meaningful physical variables, and (ii) its temporal evolution follows physically consistent dynamics. To achieve this without requiring ground-truth physical annotations, PIWM employs weak distribution-based supervision that captures state uncertainty naturally arising from real-world sensing pipelines. The architecture integrates a VQ-based visual encoder, a transformer-based physical encoder, and a learnable dynamics model grounded in known physical equations. Across three case studies (Cart Pole, Lunar Lander, and Donkey Car), PIWM achieves accurate long-horizon prediction, recovers true system parameters, and significantly improves physical grounding over purely data-driven models. These results demonstrate the feasibility and advantages of learning physically interpretable world models directly from images under weak supervision.

academic

弱教師あり表現学習による物理的に解釈可能な世界モデル

基本情報

論文ID: 2412.12870
タイトル: Physically Interpretable World Models via Weakly Supervised Representation Learning
著者: Zhenjiang Mao, Mrinall Eashaan Umasudhan, Ivan Ruchkin（フロリダ大学）
分類: cs.LG（機械学習）
発表時期: 2025年11月（arXiv v4）
論文リンク: https://arxiv.org/abs/2412.12870v4

要約

本論文は、サイバー物理システム（CPS）における世界モデルの物理的解釈可能性の欠如という問題に対処するため、物理的に解釈可能な世界モデル（PIWM）フレームワークを提案している。本フレームワークは、弱分布監督を通じて潜在表現を真の物理量と整列させ、部分的に既知の物理動力学によってその時間発展を制約する。PIWMは物理的解釈可能性の2つの相補的な属性を定義している：(i)学習された潜在状態が意味のある物理変数に対応すること、(ii)その時間発展が物理的に一貫した動力学に従うこと。Cart Pole、Lunar Lander、Donkey Carの3つのケーススタディにおいて、PIWMは正確な長時間予測、真の物理パラメータの復元、および純粋なデータ駆動型モデルに対する物理的基礎性の大幅な改善を実現している。

研究背景と動機

1. 中核的問題

標準的な世界モデルは長時間予測タスクで優れた性能を発揮するが、学習された潜在表現は通常「ブラックボックス」であり、システムの基礎となる物理状態との明確な関連性を欠いている。この物理的解釈不可能性は、自動運転やホームロボットなどの安全関連CPS応用における、モデルの使用を大きく制限している。

2. 問題の重要性

安全性要件：安全関連アプリケーションでは、予測状態の形式的検証と実行時監視が必要
因果説明：物理的に意味のある潜在状態は因果説明（例：遮蔽による減速）を提供できる
汎化能力：物理構造を組み込むことで、予測を物理的に妥当な軌跡に制約することにより汎化性を改善できる

3. 既存手法の限界

既存手法は主に2つのパラダイムに分類される：

外在的手法（Extrinsic）：まず抽象的な視覚潜在変数を学習し、その後追加モデルを通じて物理量にマッピング
内在的手法（Intrinsic）：物理構造を画像エンコーダに直接エンコード

両者とも重大な限界を持つ：

通常、訓練に正確な物理ラベルが必要
オブジェクト中心分解に依存し、実世界のCPSから確実に取得することが困難
センサーが自然に生成する不確実性推定を活用していない

4. 研究動機

実世界のCPSのセンサー（GPS、レーダーなど）は通常、正確な測定ではなく、分布形式または信頼区間の形での不確実性推定を生成する。本論文は、この分布的弱監督を利用して、高次元画像を物理的に意味のある潜在状態にガイドし、部分的に既知のシステム動力学と組み合わせることで、真の状態ラベルなしで物理的に一貫した多段階予測を実現する。

中核的貢献

統一された物理的解釈可能性の定義：生成的世界モデルの物理的解釈可能性を2つの相補的な属性として形式化：(i)潜在表現が意味のある物理量に対応すること、(ii)時間発展が物理的に有効な動力学に従うこと
弱教師あり学習フレームワーク：新規なアーキテクチャと訓練手順を提案し、分布ベースの弱監督（正確な物理ラベルではなく）を使用して、画像ベースの潜在状態を物理変数と整列させ、構造化動力学と潜在変数量化などの物理的先験を活用
体系的な実証研究：Cart Pole、Lunar Lander、Donkey Carでの広範な実験を通じて、内在的対外在的アーキテクチャ、連続対離散潜在変数の設計選択を体系的に分析し、外在的アーキテクチャ+量化潜在変数が最も堅牢で解釈可能な表現を実現することを明らかにした

方法の詳細

タスク定義

自律CPS定義（定義1）：自律CPS $s = (X, I, Y, A, \phi_\theta, g, h)$ は以下を含む：

状態集合 $X$ ：有限次元物理状態空間
初期集合 $I \subset X$ ：可能な開始状態
観測集合 $Y$ ：すべての可能な観測（画像など）
動作集合 $A$ ：利用可能な制御動作
システム動力学 $\phi_\theta: X \times A \times \Theta \rightarrow X$ ：物理パラメータ $\theta$ 下での状態遷移を支配
観測関数 $g: X \rightarrow Y$ ：状態を観測にマッピング
固定コントローラ $h: Y \rightarrow A$ ：観測に基づいて動作を選択

状態進化： $x_{t+1} = \phi(x_t, a_t, \theta^*)$ 、ここで $\theta^*$ は真の（未知の）物理パラメータ。

世界モデル定義（定義2）：世界モデル $\mathcal{W} = (\mathcal{E}, f, \mathcal{D})$ は以下を含む：

エンコーダ $\mathcal{E}: Y \rightarrow Z$ ：高次元観測を潜在表現に圧縮
予測器 $f: Z \times A \rightarrow Z$ ：動作に基づいて将来の潜在変数を予測
デコーダ $\mathcal{D}: Z \rightarrow Y$ ：予測観測を再構成

モデルアーキテクチャ

PIWMアーキテクチャは3つの中核コンポーネントを含む：

1. 物理的に解釈可能な自動エンコーダ

外在的アーキテクチャ（2段階）：

段階1：視覚自動エンコーダ $(\mathcal{E}_v, \mathcal{D}_v)$ $(E_{v}, D_{v})$ が観測 $y$ $y$ を中間潜在変数 $z = \mathcal{E}_v(y)$ $z = E_{v} (y)$ にマッピング
- 連続版： $\beta$ -VAE、損失関数： $\mathcal{L}_{\text{vision-cont}} = \mathcal{L}_{\text{recon}}(y, \hat{y}) + \beta D_{KL}(q(z|y) \| \mathcal{N}(0, I))$
- 離散版：VQ-VAE、損失関数： $\mathcal{L}_{\text{vision-disc}} = \mathcal{L}_{VQ}(y, \hat{y})$
段階2：物理エンコーダ $\mathcal{E}_p$ $E_{p}$ が $z$ $z$ を物理状態 $z^* = \mathcal{E}_p(z)$ $z^{*} = E_{p} (z)$ にマッピング
- 訓練目標： $\mathcal{L}_{\text{physical}} = \lambda_{\text{interp}}\mathcal{L}_{\text{interp}}(z^*, \Xi) + \lambda_{\text{latent}}\mathcal{L}_{\text{recon}}(z, \mathcal{D}_p(z^*))$

内在的アーキテクチャ（単一段階）：直接エンコード $z^* = \mathcal{E}(y)$ 、潜在変数を $z^* = [z^*_p, z^*_v]$ （物理部分と視覚部分）に分割

連続版損失： $\mathcal{L}_{\text{intrinsic-cont}} = \mathcal{L}_{\text{recon}}(y,\hat{y}) + \lambda_{\text{interp}}\mathcal{L}_{\text{interp}}(z^*_p, \Xi) + \beta D_{KL}(q(z^*_v|y) \| \mathcal{N}(0, I))$
離散版：コードブックベクトルを $e_k = [e^p_k, e^v_k]$ に分割、ここで $e^p_k$ は固定物理グリッドポイント $\mathcal{L}_{\text{intrinsic-disc}} = \mathcal{L}_{VQ}(y,\hat{y}) + \lambda_{\text{interp}}\mathcal{L}_{\text{interp}}(z^*_p, \Xi)$

2. 学習可能な動力学モデル

構造化された2階動力学モデルを使用： $z^*_{t+2} = \phi_\theta(z^*_t, z^*_{t+1}, a_{t+1})$

ここで $\phi$ の関数形式（運動方程式など）は既知で、パラメータ $\theta$ （質量、摩擦係数など）のみが学習可能。

動力学損失： $\mathcal{L}_{\text{dyn}}(\theta) = \|z^*_{t+H} - \mu_{\xi_{t+H}}\|^2_2$

ここで $\mu_{\xi_{t+H}} = \frac{1}{L}\sum_{l=1}^L \xi^{(l)}_{t+H}$ は弱監督サンプルの経験平均。

3. 弱監督メカニズム

解釈可能性損失： $\mathcal{L}_{\text{interp}}(z^*_p, \Xi) = \|z^*_p - \mu_\xi\|^2_2$

ここで $\Xi = \{\xi^{(l)}\}_{l=1}^L$ は未知分布 $p(x)$ から抽出された $L$ 個のプロキシサンプル。

ノイズモデル：真の値 $x_i$ が分布平均を中心とした相対幅 $\delta$ の区間内に位置すると仮定： $x_i \in [\mathbb{E}[p(x)] - \frac{1}{2}\delta|\mathcal{X}_i|, \mathbb{E}[p(x)] + \frac{1}{2}\delta|\mathcal{X}_i|]$

技術的革新点

分離設計：外在的アーキテクチャが視覚知覚と物理状態推論を分離し、独立した最適化を可能に
量化正則化：VQ-VAEの離散化が強い正則化器として機能し、視覚ノイズを抑制し、物理状態マッピングを安定化
構造化動力学：ブラックボックスシーケンスモデルではなく部分的に既知の物理方程式を使用し、汎化性と解釈可能性を向上
弱監督の活用：正確な物理ラベルが不要で、分布サンプルのみが必要であり、実際のセンサー特性とより一致
2階初期化：連続する2つの状態 $(z^*_t, z^*_{t+1})$ を使用して初期化し、モデルが速度などの導関数量を内部で計算可能に

実験設定

データセット

3つの環境：

Cart Pole：古典的な制御問題、バランス棒システム
Lunar Lander：OpenAI Gym環境、月着陸船制御
Donkey Car：自律レーシングプラットフォーム、実世界の視覚複雑シーン

各環境で60,000個の軌跡を収集、各軌跡は最低50個の時間ステップ。軌跡はランダム動作と訓練済みニューラルコントローラで生成され、多様な状態空間カバレッジを確保。

弱監督生成

監督ノイズ $\delta \in \{0\%, 5\%, 10\%\}$ ：

各状態成分 $x_i$ に対して、オフセット中心 $\tilde{x}_i = x_i + \Delta_i$ を生成、ここで $\Delta_i \sim \text{Unif}[-\frac{1}{2}\delta|\mathcal{X}_i|, \frac{1}{2}\delta|\mathcal{X}_i|]$
監督分布： $p_i(x) = \text{Unif}[\tilde{x}_i - \frac{1}{2}\delta|\mathcal{X}_i|, \tilde{x}_i + \frac{1}{2}\delta|\mathcal{X}_i|]$
各時間ステップで $L=50$ 個のサンプルを抽出してプロキシ監督集合 $\Xi$ を形成

評価指標

予測精度：30ステップ予測の二乗平均平方根誤差（RMSE）
静的エンコード品質：潜在状態 $z^*_p$ と弱監督サンプル平均のMSEとKL発散
パラメータ復元：学習された物理パラメータ $\theta$ と真の値 $\theta^*$ の相対誤差
定性的評価：長時間軌跡ロールアウトの視覚品質
コントローラ性能：再構成観測上の動作RMSE/精度

比較手法

内在的手法ベースライン：

Vid2Para：ビデオから物理パラメータを学習
GokuNet：ODE制約を使用した生成モデル

外在的手法ベースライン：

DVBF（Deep Variational Bayes Filters）：深層変分ベイズフィルタ
SindyC：スパース動力学識別（本論文のエンコーダの潜在変数で操作）

データ駆動型ベースライン：

LSTM：長短期記憶ネットワーク
Transformer：標準Transformerシーケンスモデル

実装詳細

視覚エンコーダ：2層CNN、64次元潜在変数
離散変種：512エントリコードブック、commitment loss重み $\beta=0.25$
物理エンコーダ：2層Transformer（4ヘッド、512フィードフォワード次元）、平均プーリング+線形投影
最適化器：Adam、バッチサイズ32
学習率：連続変種 $10^{-4}$ 、離散変種 $10^{-3}$
学習率スケジュール：コサイン減衰、5エポック予熱
訓練：最大200エポック、早期停止耐性20エポック
勾配クリッピング：1.0
評価：5分割交差検証

実験結果

主要結果

長時間予測性能（図3、図4）：

Donkey Car環境：

外在的離散PIWM（紫線）：すべてのノイズレベルで最低かつ最も安定した予測誤差を達成
外在的連続PIWM（赤線）：2番目に優れた性能
すべてのベースライン（DVBF、SindyC、LSTM、Transformer）を大幅に上回る

Cart PoleおよびLunar Lander：

PIWM変種は $\delta=0\%$ でRMSE約1.5-2.0
$\delta=10\%$ でRMSE 2.5-3.5に増加
ベースライン手法は誤差が急速に累積し、30ステップで3.5-4.0に達する

内在的対外在的比較：

内在的連続モデルは特定のシーンで外在的モデルと競争力がある
内在的離散モデルは安定性が低く、単一エンコーダで離散コードブックを整列させる最適化の課題を示唆
外在的アーキテクチャが視覚知覚と物理解釈を分離することが、堅牢な長期予測を実現するための重要な設計

連続対離散比較：

内在的アーキテクチャ：連続潜在変数がより優れた性能（柔軟な勾配が結合視覚-物理目標に適応）
外在的アーキテクチャ：離散潜在変数がより優れた性能（量化が視覚ノイズを抑制し、物理状態マッピングを安定化）

静的エンコード品質（表1）

すべての環境とノイズレベルで：

外在的離散：最低MSE（Donkey Car $\delta=0\%$ : 0.03±0.02）
内在的連続：次点（Donkey Car $\delta=0\%$ : 0.13±0.05）
KL発散傾向は一貫し、外在的離散モデルが最低（0.19±0.03）

ノイズの影響：

$\delta$ が0%から10%に増加すると、MSEは約50-100%増加
外在的離散モデルはノイズに最も堅牢

物理パラメータ復元（図5）

Cart Pole：

棒質量：学習値は真の値（黄線）と高度に一致
棒長：すべてのノイズレベルで正確に復元
カート長と加力：相対誤差<10%

Lunar Lander：

メインエンジン出力：正確に復元（相対誤差<5%）
サイドエンジン出力：若干の偏差だが合理的範囲内

Donkey Car：

近似自転車モデルを使用、真のパラメータは未知
学習された軸距は異なるノイズレベルで一貫性を保持

定性的分析（図6、図8）

30ステップ軌跡ロールアウト比較：

PIWM：生成された画像は予測時間領域全体で視覚的明瞭性と物理的一貫性を維持
ベースライン：H=15後に明らかなぼやけと物理的に不合理な配置が出現
Cart Pole：PIWMは棒の振動とバランス状態を正確に予測
Lunar Lander：PIWMは着陸船の姿勢と位置変化を正しく捉える

コントローラ性能（表2）

再構成観測上の元のコントローラを評価：

Donkey Car（動作RMSE、低いほど良い）：

外在的離散： $\delta=0\%$ で0.15±0.04、 $\delta=10\%$ で0.19±0.05
内在的連続： $\delta=0\%$ で0.12±0.04、 $\delta=10\%$ で0.15±0.05

Lunar Lander（動作精度、高いほど良い）：

外在的離散： $\delta=0\%$ で91.5%±2.1%、 $\delta=10\%$ で84.5%±2.5%
内在的連続： $\delta=0\%$ で93.0%±1.8%、 $\delta=10\%$ で87.1%±2.2%

Cart Pole（動作精度）：

外在的離散： $\delta=0\%$ で97.2%±1.1%、 $\delta=10\%$ で92.5%±1.8%
内在的連続： $\delta=0\%$ で98.0%±1.0%、 $\delta=10\%$ で94.0%±1.5%

重要な発見：物理的解釈可能性の大幅な改善は、下流制御性能への最小限の損失でのみ実現。

実験的発見

アーキテクチャ選択が重要：外在的アーキテクチャ+離散潜在変数が最適な組み合わせ
弱監督の有効性： $\delta=10\%$ ノイズ下でも、PIWMは物理パラメータを復元可能
長時間安定性：構造化動力学は30ステップ以上の予測安定性を大幅に改善
物理的基礎性：学習された表現は関連するだけでなく、物理的に根拠がある
汎化能力：量化正則化は未見状態への汎化を改善

結論と議論

主要な結論

外在的+離散が最適構成：予測精度、物理的基礎性、堅牢性で最高性能
弱監督の十分性：分布的弱監督は物理的に意味のある表現学習に十分
物理的解釈可能性は検証可能：パラメータ復元を通じて直接的証拠を提供
実用性：最小限の制御性能損失で大幅な解釈可能性改善を実現

限界

マルコフ仮定：現在の実験はマルコフ動力学に焦点、非マルコフまたは遅延効果システムへの拡張には追加メモリメカニズムが必要
単純な動力学：実験は相対的に単純な物理モデル（4-10パラメータ）を使用、複雑システムのスケーラビリティは未検証
弱監督品質：性能は監督分布の品質に依存、極端なノイズは失敗につながる可能性
計算オーバーヘッド：2段階訓練（外在的アーキテクチャ）は訓練時間を増加
環境限定：主にシミュレーション環境で検証、実世界展開には追加研究が必要

将来の方向

複雑な世界表現：単純な状態ベクトル予測から構造化世界表現（動的3D占有グリッドなど）への拡張
時系列監督の活用：フィルタリングまたはシーケンスモデリング技術を使用して弱監督信号シーケンスを処理し、より洗練された時系列一貫性学習目標を生成
非マルコフシステム：複数ステップにわたる時系列依存性を持つシステムへの拡張
開放世界シーン：自動運転などの複雑な開放世界シーンへの応用、マルチエージェント処理
オンライン適応：物理パラメータをオンラインで更新し環境変化に適応するメカニズムの開発

深層評価

利点

問題定義が明確：物理的解釈可能性の2つの相補的次元を形式化し、理論的ギャップを埋める
方法の革新性が高い：
- 弱監督メカニズムは新規で、実際のセンサー特性により適合
- 内在的/外在的×連続/離散の設計空間を体系的に探索
- 構造化動力学と学習表現の統合は優雅
実験設計が厳密：
- 異なる複雑度の3つの環境で汎化性を検証
- 5分割交差検証で統計的信頼性を確保
- 多次元評価（予測、エンコード、パラメータ復元、コントローラ性能）
結果が説得力がある：
- 定量的および定性的結果が主要論点を一貫して支持
- パラメータ復元は物理的解釈可能性の直接的証拠を提供
- アブレーション研究（連続対離散、内在的対外在的）は深い洞察を明らかに
文章が明確：論文構造が合理的、数学表記が厳密、図表が情報豊富

不足

理論分析が不足：
- 弱監督下の収束性の理論的保証がない
- ノイズレベル $\delta$ の理論的上界分析がない
- 量化正則化効果の理論的説明がない
実験限界：
- シミュレーション環境のみで検証、実世界センサーノイズはより複雑
- 物理モデルは相対的に単純（2階動力学）、複雑システム（軟体ロボットなど）は未検討
- 最新のTransformerベース世界モデル（IRIS、Genieなど）との比較がない
スケーラビリティ問題：
- 2段階訓練は計算コストを増加
- 高次元物理状態空間の処理が不明確
- コードブックサイズ（512）はより複雑な環境では不足の可能性
方法の限界：
- 部分的に既知の動力学方程式が必要で、応用範囲を制限
- 弱監督サンプル数（L=50）の感度が十分に研究されていない
- コントローラが固定で、政策学習との共同最適化を探索していない
分析の深さ：
- 外在的離散が内在的連続より優れる理由の機構的説明が不十分
- 異なる物理パラメータの復元可能性の差異が詳細に議論されていない
- 失敗ケースの分析が欠落

影響力

学術的貢献：
- 物理的解釈可能世界モデルの統一フレームワークと評価ベンチマークを提供
- 弱監督パラダイムは物理整列を必要とする他の学習タスクにインスピレーションを与える可能性
- 設計空間の体系的探索は後続研究にガイダンスを提供
実用的価値：
- 安全関連CPS予測と監視への直接応用
- 正確な物理ラベルへの依存を低減し、データ収集コストを削減
- 解釈可能性は形式的検証と実行時保証をサポート
再現性：
- 詳細なアーキテクチャとハイパーパラメータ説明（付録）
- 標準環境使用（OpenAI Gym）
- ただしコードは公開されておらず、再現に影響の可能性
潜在的影響：
- 世界モデルを純粋な予測性能から解釈可能性と信頼性へシフトさせる可能性
- ロボット学習、自動運転などの分野に新しいツールを提供
- 弱監督思想は他の物理組み込み学習タスクに転移可能

適用シーン

適切なシーン：

安全関連システム：自動運転、航空宇宙など解釈可能予測が必要
部分観測環境：センサーが不確実性推定を提供するロボットシステム
既知動力学構造：物理方程式形式は既知だがパラメータ未知のシステム
長時間予測：物理一貫性が必要な多段階予測タスク
リソース制限ラベリング：正確な物理ラベルが困難な応用

不適切なシーン：

完全未知動力学：物理先験を提供できないブラックボックスシステム
高度に非マルコフシステム：状態遷移が長い履歴に依存するタスク
極端なノイズ環境：弱監督品質が極めて悪い（ $\delta > 20\%$ ）場合
厳密な実時間要件：2段階訓練とTransformer推論が遅すぎる可能性
純粋視覚タスク：物理解釈が不要な画像生成タスク

参考文献（主要引用）

Ha & Schmidhuber (2018)：World Models - 古典的世界モデルフレームワーク
Hafner et al. (2020, 2023)：Dreamerシリーズ - SOTA世界モデルベースライン
Karl et al. (2016)：DVBF - 深層変分ベイズフィルタ
Asenov et al. (2019)：Vid2Param - ビデオから物理パラメータを学習
Linial et al. (2021)：GokuNet - ODE使用生成モデル
Van Den Oord et al. (2017)：VQ-VAE - ベクトル量化変分自動エンコーダ
Brunton et al. (2016)：SINDYc - スパース非線形動力学識別

総合評価：これは物理的解釈可能世界モデル分野における重要な貢献をした高品質な研究論文である。その中核的革新は、弱監督と構造化設計を巧みに活用して、正確なラベル付けなしで物理的解釈可能性を実現することにある。体系的な実験設計と説得力のある結果が主要論点を支持している。理論分析の不足と実世界検証の欠如という限界があるものの、その方法論と発見は将来の研究に堅実な基礎を提供し、学術的および実用的価値が重要である。