2025-11-11T08:22:09.471735

FP-AbDiff: Improving Score-based Antibody Design by Capturing Nonequilibrium Dynamics through the Underlying Fokker-Planck Equation

Chen, Xiong, Li et al.
Computational antibody design holds immense promise for therapeutic discovery, yet existing generative models are fundamentally limited by two core challenges: (i) a lack of dynamical consistency, which yields physically implausible structures, and (ii) poor generalization due to data scarcity and structural bias. We introduce FP-AbDiff, the first antibody generator to enforce Fokker-Planck Equation (FPE) physics along the entire generative trajectory. Our method minimizes a novel FPE residual loss over the mixed manifold of CDR geometries (R^3 x SO(3)), compelling locally-learned denoising scores to assemble into a globally coherent probability flow. This physics-informed regularizer is synergistically integrated with deep biological priors within a state-of-the-art SE(3)-equivariant diffusion framework. Rigorous evaluation on the RAbD benchmark confirms that FP-AbDiff establishes a new state-of-the-art. In de novo CDR-H3 design, it achieves a mean Root Mean Square Deviation of 0.99 Å when superposing on the variable region, a 25% improvement over the previous state-of-the-art model, AbX, and the highest reported Contact Amino Acid Recovery of 39.91%. This superiority is underscored in the more challenging six-CDR co-design task, where our model delivers consistently superior geometric precision, cutting the average full-chain Root Mean Square Deviation by ~15%, and crucially, achieves the highest full-chain Amino Acid Recovery on the functionally dominant CDR-H3 loop (45.67%). By aligning generative dynamics with physical laws, FP-AbDiff enhances robustness and generalizability, establishing a principled approach for physically faithful and functionally viable antibody design.
academic

FP-AbDiff: Fokker-Planck方程の基礎となる非平衡動力学の捕捉によるスコアベース抗体設計の改善

基本情報

  • 論文ID: 2511.03113
  • タイトル: FP-AbDiff: Improving Score-based Antibody Design by Capturing Nonequilibrium Dynamics through the Underlying Fokker-Planck Equation
  • 著者: Jiameng Chen, Yida Xiong, Kun Li, Hongzhi Zhang, Xiantao Cai, Wenbin Hu, Jia Wu
  • 分類: cs.LG cs.AI q-bio.QM
  • 発表日: 2025年11月5日(arXiv プレプリント)
  • 論文リンク: https://arxiv.org/abs/2511.03113

要約

計算抗体設計は治療薬発見において大きな可能性を秘めているが、既存の生成モデルは2つの根本的な課題に直面している:(i) 動力学的一貫性の欠如により物理的に不合理な構造が生成される、(ii) データの希少性と構造的偏りによる汎化能力の低さ。本論文ではFP-AbDiffを提案する。これは生成軌跡全体にわたってFokker-Planck方程式(FPE)の物理法則を強制する初の抗体生成器である。本手法はCDR幾何学の混合多様体(R³×SO(3))上で新規なFPE残差損失を最小化し、局所的に学習された除去ノイズスコアを全体的に一貫した確率流へと組み立てることを強制する。この物理情報正則化器は、最先端のSE(3)等変拡散フレームワーク内で深い生物学的先験と協調的に統合される。

研究背景と動機

問題定義

抗体設計は2つの重要な課題に直面している:

  1. 動力学的一貫性の欠如:DiffAb、AbDiffuser、AbXなどの既存拡散モデルは、個別のノイズレベルの構造を最適化するが、それらを結ぶ経路を制約しない。これらの除去ノイズスコアマッチング(DSM)目標は局所勾配を捉えるが、全体的な変換を無視し、化学的に不合理な環の再配置、不安定な側鎖の積み重ね、エネルギー的に緊張した立体配座をしばしば生成する。
  2. 汎化能力の不足:拡散生成器は現在のデータセットの狭い範囲外では性能が低下し、実用的な応用価値を制限している。主要なベンチマークであるSAbDabは5000未満の非冗長複合体を含み、少数のヒトIgGスキャフォールドとウイルス表位結合に大きく偏っている。

研究動機

CDR特異性と親和性は孤立した構造スナップショットではなく、微妙で連続的な立体配座運動に由来する。既存手法は時間的一貫性を強制する明確なメカニズムを欠いており、分布外(OOD)タスクに直面すると馴染みのあるパターンへの回帰が頻繁に起こる。

核心的貢献

  1. 初のFPE正則化フレームワーク:FP-AbDiffはCDRに対する初の拡散フレームワークを導入し、R³×SO(3)上でスコア-Fokker-Planck一貫性を強制し、全体的に一貫した確率流を保証し、非物理的な環転移を排除する。
  2. 物理法則と生物学的先験の統一:Fokker-Planck物理学を進化、幾何学、エネルギー先験と単一の目的に統一し、動力学的に一貫した汎化可能な抗体生成を実現する。
  3. 最先端性能の突破:抗体設計と最適化タスクにおいて最先端性能を達成し、CDR-H3設計で0.99 ÅのRMSDFv(AbXより25%改善)と39.91%の接触アミノ酸回復率を達成する。

方法の詳細

タスク定義

抗体設計は構造コンテキストC(抗原とフレームワーク)が与えられた条件付きCDR生成として定式化される。CDRはt=0での真の状態S₀=(A₀,X₀,R₀)で定義され、以下を含む:

  • アミノ酸配列A₀
  • 重原子座標X₀∈R^(Dx)
  • 残基方向R₀∈SO(3)^(NCDR)

モデルアーキテクチャ

確率動力学のモデリング

並進動力学(ユークリッド空間): 骨格座標Xt∈R³は分散保存(VP) SDE により進化する:

dXt = -½βX(t)Xt dt + √βX(t) dWX,t

回転動力学(SO(3)多様体): 各残基の方向Ri,t∈SO(3)は分散爆発(VE) SDE により進化する:

dRi,t = √βR(t) Σ(Ri,tEa) ∘ dWᵃt

Fokker-Planck方程式の導出

一般的なSDE dx_t = f(x_t,t)dt + g(t)dW_t に対して、FPEは確率密度p(x,t)の進化を記述する:

∂p/∂t = -∇·(fp) + ½g²(t)Δp

ユークリッド空間動力学: 進化演算子GXは以下のように定義される:

GX[sX,X,t] := ½βX(t)[sX + (∇XsX)X + HX(sX)]

SO(3)多様体動力学: 進化演算子GRは以下のように定義される:

GR[sR,R,t] := ½βR(t)[ΔBsR - 2sR + HR(sR)]

FPE残差正則化

ネットワークが予測したクリーンなCDRを正確な並進および回転スコアに変換する間接スコア推論を通じて:

並進スコア:

sθ,X(Xt,t|Xθ₀) = -(Xt - αX(t)Xθ₀)/σ²X(t)

回転スコア:

sθ,R(Rt,t|Rθ₀) = ∇SO(3) log pIGSO(3)((Rθ₀)ᵀRt; σ²R(t))

FPE残差は以下のように定義される:

εX(Xt,t) := ∂tsθ,X(Xt,t|Xθ₀) - GX[sθ,X,Xt,t]
εR(Rt,t) := ∂tsθ,R(Rt,t|Rθ₀) - GR[sθ,R,Rt,t]

訓練目的関数

忠実度損失

Lfid = L^X_DSM + L^R_DSM + 0.4·LCE

生物物理学的妥当性先験

Lpriors = LFAPE + 0.5Ldist + 0.1LpLDDT + 0.03Lviol + 0.25Lbb

動力学的一貫性正則化器

Lfpe(θ) = Et,St[w(t)(||εX||²/DX + ||εR||²/DR)]

完全な損失関数

Ltotal = Lfid + It<τLpriors + 0.05·Lfpe

実験設定

データセット

  • 訓練セット:SAbDab由来の非冗長セット(2024年9月)、CDR-H3配列同一性≤40%
  • テストセット:RaBDベンチマークの60個の抗体-抗原複合体

評価指標

  • 配列回復:AARFv、AARFull、CAAR(接触アミノ酸回復率)
  • 構造精度:RMSDFv、RMSDFull、TM-score、lDDT
  • 機能的実行可能性:IMP(∆∆G<0のサンプル割合)、DockQ

比較手法

  • 拡散モデル:DiffAb、AbX
  • エネルギーガイド付きパイプライン:RosettaAb
  • 等変GNN:dyMEAN、MEAN
  • 自己回帰配列モデル:HERN

実験結果

主要結果

CDR-H3設計タスク

モデルAAR↑TMscore↑lDDT↑CAAR↑RMSD↓DockQ↑
AbX84.90%0.99060.940739.08%1.320.429
FP-AbDiff83.65%0.99290.936339.91%0.990.444

FP-AbDiffはRMSDFvで25%の改善を達成し、サブオングストローム精度0.99 Åに到達し、最高のCAARである39.91%を獲得した。

6つのCDR協調設計

より困難な全副位部位設計タスクでは、FP-AbDiffは6つすべてのCDRで最低のRMSDFullを達成し、AbXと比較して平均幾何誤差を約15%削減し、機能的に重要なCDR-H3ループで最高のAARFull(45.67%)に到達した。

アブレーション実験

モデル変体IMP(%)↑AAR(%)↑RMSD(Å)↓DockQ↑
+R³, +SO(3)28.4245.232.180.4443
-SO(3)35.3044.152.460.4437
-R³29.7643.142.410.4372

完全なモデルは最高の忠実度を達成し、R³項を削除すると骨格とインターフェース品質が低下し、SO(3)項を削除するとIMPは増加するがRMSDとAARは悪化する。

抗体最適化実験

反復除去ノイズ最適化において、AbXは「高ゲインだが脆弱」な軌跡に従うのに対し、FP-AbDiffはt=8から一貫して低いRMSDと高いDockQを維持し、より安定した最適化経路を反映している。

関連研究

従来の手法

RosettaAntibodyDesignなどの初期手法は統計的エネルギー関数とモンテカルロサンプリングに依存しているが、高い計算コストと限定的なサンプリング効率に制限されている。

深層学習手法

  • 配列中心モデル:タンパク質言語モデルはタンパク質をテキスト入力として扱うが、空間的および幾何学的先験を無視する
  • 幾何学的等変モデル:MEAN、dyMEANなどのGNNモデルおよびAlphaFold2などの予測器
  • 拡散モデル:DiffAb、AbDiffuserなど、ただし時間的一貫性を欠く

本論文の利点

FP-AbDiffは抗体生成において物理的自己一貫性を課す初のフレームワークであり、Fokker-Planck正則化を通じて動力学的一貫性の問題を解決する。

結論と議論

主要な結論

FP-AbDiffはFokker-Planck物理法則の強制を通じて、抗体設計のすべての評価タスクにおいて一貫して最先端のベースラインを上回り、高忠実度構造、正確なインターフェース、および安定した生成軌跡を実現する。

制限事項

  1. 数値近似:FPE残差の実装は有限差分とHutchinson技巧などの近似手法に依存する
  2. 計算オーバーヘッド:訓練時間を8%増加させるだけだが、追加の前向き伝播が必要である
  3. 実験的検証:設計された抗体の機能性に関する湿式実験検証が不足している

今後の方向性

  1. 数値近似手法を改善して精度を向上させる
  2. 他のタンパク質設計タスクへの拡張
  3. 実験的フィードバックを組み込んだモデル最適化
  4. より複雑な物理的制約の探索

深い評価

利点

  1. 理論的革新:Fokker-Planck方程式を抗体設計に初めて導入し、動力学的一貫性の問題を解決する
  2. 技術的先進性:物理法則と深層学習を巧妙に組み合わせ、混合多様体R³×SO(3)上で一貫性制約を実現する
  3. 実験の充実:包括的なベースライン比較、アブレーション実験、ケーススタディ
  4. 性能の優位性:複数の指標で最先端を達成し、特に25%のRMSD改善は顕著である

不足点

  1. 複雑性の増加:手法は比較的複雑で、実装の詳細が多い
  2. 理論的分析の不足:FPE正則化の収束性に関する理論的保証が欠ける
  3. 適用範囲:主に抗体設計に焦点を当てており、他のタンパク質設計への汎化能力は未知である

影響力

本研究は計算生物学と機械学習の交差領域に新しい研究パラダイムを提供し、物理法則と深い生成モデルを組み合わせ、タンパク質設計、医薬品発見などの分野に重要な意義を持つ。

適用シーン

  • 治療用抗体設計
  • 抗体工学と最適化
  • 物理的一貫性が必要な他の分子生成タスク
  • 構造生物学研究

参考文献

論文は広範な関連研究を引用しており、以下を含む:

  • 拡散モデルの基礎理論(Song & Ermon 2019; Ho et al. 2020)
  • 抗体設計手法(Adolf-Bryfogle et al. 2018; Luo et al. 2022)
  • 幾何学的深層学習(Yim et al. 2023; Bortoli et al. 2022)
  • Fokker-Planck方程式の応用(Lai et al. 2023)

本論文は計算抗体設計分野に重要な貢献をなし、物理的制約を導入することで生成モデルの性能と信頼性を大幅に向上させ、将来のタンパク質設計研究に価値のある新しい視点を提供している。