2025-11-11T08:22:09.471735

FP-AbDiff: Improving Score-based Antibody Design by Capturing Nonequilibrium Dynamics through the Underlying Fokker-Planck Equation

Chen, Xiong, Li et al.
Computational antibody design holds immense promise for therapeutic discovery, yet existing generative models are fundamentally limited by two core challenges: (i) a lack of dynamical consistency, which yields physically implausible structures, and (ii) poor generalization due to data scarcity and structural bias. We introduce FP-AbDiff, the first antibody generator to enforce Fokker-Planck Equation (FPE) physics along the entire generative trajectory. Our method minimizes a novel FPE residual loss over the mixed manifold of CDR geometries (R^3 x SO(3)), compelling locally-learned denoising scores to assemble into a globally coherent probability flow. This physics-informed regularizer is synergistically integrated with deep biological priors within a state-of-the-art SE(3)-equivariant diffusion framework. Rigorous evaluation on the RAbD benchmark confirms that FP-AbDiff establishes a new state-of-the-art. In de novo CDR-H3 design, it achieves a mean Root Mean Square Deviation of 0.99 Å when superposing on the variable region, a 25% improvement over the previous state-of-the-art model, AbX, and the highest reported Contact Amino Acid Recovery of 39.91%. This superiority is underscored in the more challenging six-CDR co-design task, where our model delivers consistently superior geometric precision, cutting the average full-chain Root Mean Square Deviation by ~15%, and crucially, achieves the highest full-chain Amino Acid Recovery on the functionally dominant CDR-H3 loop (45.67%). By aligning generative dynamics with physical laws, FP-AbDiff enhances robustness and generalizability, establishing a principled approach for physically faithful and functionally viable antibody design.
academic

FP-AbDiff: Improving Score-based Antibody Design by Capturing Nonequilibrium Dynamics through the Underlying Fokker-Planck Equation

基本信息

  • 论文ID: 2511.03113
  • 标题: FP-AbDiff: Improving Score-based Antibody Design by Capturing Nonequilibrium Dynamics through the Underlying Fokker-Planck Equation
  • 作者: Jiameng Chen, Yida Xiong, Kun Li, Hongzhi Zhang, Xiantao Cai, Wenbin Hu, Jia Wu
  • 分类: cs.LG cs.AI q-bio.QM
  • 发表时间: 2025年11月5日(arXiv预印本)
  • 论文链接: https://arxiv.org/abs/2511.03113

摘要

计算抗体设计在治疗性发现方面具有巨大潜力,但现有生成模型受到两个核心挑战的根本限制:(i) 缺乏动力学一致性,导致物理上不合理的结构;(ii) 由于数据稀缺和结构偏差导致的泛化能力差。本文引入FP-AbDiff,这是第一个在整个生成轨迹上强制执行Fokker-Planck方程(FPE)物理定律的抗体生成器。该方法在CDR几何的混合流形(R³×SO(3))上最小化新颖的FPE残差损失,迫使局部学习的去噪分数组装成全局一致的概率流。这种物理信息正则化器与深度生物先验在最先进的SE(3)等变扩散框架内协同集成。

研究背景与动机

问题定义

抗体设计面临两个关键挑战:

  1. 动力学一致性缺失:现有扩散模型如DiffAb、AbDiffuser和AbX优化独立噪声水平的结构,从不约束连接它们的路径。它们的去噪分数匹配(DSM)目标捕获局部梯度但忽略全局转换,经常产生化学上不合理的环重排、不稳定的侧链堆积和能量紧张的构象体。
  2. 泛化能力不足:扩散生成器在当前数据集的狭窄范围外表现不佳,限制了其实际应用价值。主要基准SAbDab包含少于5000个非冗余复合物,且严重偏向少数人类IgG支架与病毒表位结合。

研究动机

CDR特异性和亲和力来自微妙的、连续的构象运动,而不是孤立的结构快照。现有方法缺乏明确的机制来强制时间一致性,且在面对分布外(OOD)任务时经常回退到熟悉的模式。

核心贡献

  1. 首创FPE正则化框架:FP-AbDiff引入了首个针对CDR的扩散框架,在R³×SO(3)上强制执行分数-Fokker-Planck一致性,确保全局一致的概率流并消除非物理环转换。
  2. 物理定律与生物先验统一:将Fokker-Planck物理学与进化、几何和能量先验统一到单一目标中,实现动力学一致和可泛化的抗体生成。
  3. SOTA性能突破:在抗体设计和优化任务上实现最先进性能,在CDR-H3设计中达到0.99 Å的RMSDFv(比AbX改进25%)和39.91%的接触氨基酸恢复率。

方法详解

任务定义

抗体设计被表述为给定结构上下文C(抗原和框架)的条件CDR生成。CDR由其在t=0时的真实状态S₀=(A₀,X₀,R₀)定义,包括:

  • 氨基酸序列A₀
  • 重原子坐标X₀∈R^(Dx)
  • 残基方向R₀∈SO(3)^(NCDR)

模型架构

随机动力学建模

平移动力学(欧几里得空间): 骨架坐标Xt∈R³通过方差保持(VP) SDE演化:

dXt = -½βX(t)Xt dt + √βX(t) dWX,t

旋转动力学(SO(3)流形): 每个残基的方向Ri,t∈SO(3)通过方差爆炸(VE) SDE演化:

dRi,t = √βR(t) Σ(Ri,tEa) ∘ dWᵃt

Fokker-Planck方程推导

对于一般SDE dx_t = f(x_t,t)dt + g(t)dW_t,FPE描述概率密度p(x,t)的演化:

∂p/∂t = -∇·(fp) + ½g²(t)Δp

欧几里得空间动力学: 演化算子GX定义为:

GX[sX,X,t] := ½βX(t)[sX + (∇XsX)X + HX(sX)]

SO(3)流形动力学: 演化算子GR定义为:

GR[sR,R,t] := ½βR(t)[ΔBsR - 2sR + HR(sR)]

FPE残差正则化

通过间接分数推断将网络预测的清洁CDR转换为精确的平移和旋转分数:

平移分数:

sθ,X(Xt,t|Xθ₀) = -(Xt - αX(t)Xθ₀)/σ²X(t)

旋转分数:

sθ,R(Rt,t|Rθ₀) = ∇SO(3) log pIGSO(3)((Rθ₀)ᵀRt; σ²R(t))

FPE残差定义为:

εX(Xt,t) := ∂tsθ,X(Xt,t|Xθ₀) - GX[sθ,X,Xt,t]
εR(Rt,t) := ∂tsθ,R(Rt,t|Rθ₀) - GR[sθ,R,Rt,t]

训练目标

保真度损失

Lfid = L^X_DSM + L^R_DSM + 0.4·LCE

生物物理合理性先验

Lpriors = LFAPE + 0.5Ldist + 0.1LpLDDT + 0.03Lviol + 0.25Lbb

动力学一致性正则化器

Lfpe(θ) = Et,St[w(t)(||εX||²/DX + ||εR||²/DR)]

完整损失函数

Ltotal = Lfid + It<τLpriors + 0.05·Lfpe

实验设置

数据集

  • 训练集:基于SAbDab衍生的非冗余集合(2024年9月),CDR-H3序列同一性≤40%
  • 测试集:RAbD基准的60个抗体-抗原复合物

评价指标

  • 序列恢复:AARFv、AARFull、CAAR(接触氨基酸恢复率)
  • 结构精度:RMSDFv、RMSDFull、TM-score、lDDT
  • 功能可行性:IMP(∆∆G<0的样本百分比)、DockQ

对比方法

  • 扩散模型:DiffAb、AbX
  • 能量引导管道:RosettaAb
  • 等变GNN:dyMEAN、MEAN
  • 自回归序列模型:HERN

实验结果

主要结果

CDR-H3设计任务

模型AAR↑TMscore↑lDDT↑CAAR↑RMSD↓DockQ↑
AbX84.90%0.99060.940739.08%1.320.429
FP-AbDiff83.65%0.99290.936339.91%0.990.444

FP-AbDiff在RMSDFv上实现25%的改进,达到亚埃级精度0.99 Å,并获得最高的CAAR 39.91%。

六CDR协同设计

在更具挑战性的全副位点设计任务中,FP-AbDiff在所有六个CDR上都实现了最低的RMSDFull,平均几何误差比AbX降低约15%,在功能关键的CDR-H3环上达到最高的AARFull(45.67%)。

消融实验

模型变体IMP(%)↑AAR(%)↑RMSD(Å)↓DockQ↑
+R³, +SO(3)28.4245.232.180.4443
-SO(3)35.3044.152.460.4437
-R³29.7643.142.410.4372

完整模型实现最高保真度,移除R³项会降低骨架和界面质量,移除SO(3)项虽然IMP增加但RMSD和AAR变差。

抗体优化实验

在迭代去噪优化中,AbX遵循"高增益但脆弱"轨迹,而FP-AbDiff从t=8开始保持一致的较低RMSD和较高DockQ,反映出更稳定的优化路径。

相关工作

传统方法

早期方法如RosettaAntibodyDesign依赖统计能量函数和蒙特卡罗采样,但受到高计算成本和有限采样效率的限制。

深度学习方法

  • 序列中心模型:蛋白质语言模型将蛋白质视为文本输入,但忽略空间和几何先验
  • 几何等变模型:MEAN、dyMEAN等GNN模型和AlphaFold2等预测器
  • 扩散模型:DiffAb、AbDiffuser等,但缺乏时间一致性

本文优势

FP-AbDiff是首个在抗体生成中施加物理自一致性的框架,通过Fokker-Planck正则化解决动力学一致性问题。

结论与讨论

主要结论

FP-AbDiff通过强制执行Fokker-Planck物理定律,在抗体设计的所有评估任务中始终优于最先进基线,实现高保真结构、精确界面和稳定生成轨迹。

局限性

  1. 数值近似:FPE残差的实现依赖有限差分和Hutchinson技巧等近似方法
  2. 计算开销:虽然只增加8%的训练时间,但仍需额外的前向传播
  3. 实验验证:缺乏湿实验验证设计抗体的功能性

未来方向

  1. 改进数值近似方法提高精度
  2. 扩展到其他蛋白质设计任务
  3. 结合实验反馈进行模型优化
  4. 探索更复杂的物理约束

深度评价

优点

  1. 理论创新:首次将Fokker-Planck方程引入抗体设计,解决动力学一致性问题
  2. 技术先进:巧妙结合物理定律与深度学习,在混合流形R³×SO(3)上实现一致性约束
  3. 实验充分:全面的基线对比、消融实验和案例分析
  4. 性能突出:在多个指标上达到SOTA,特别是25%的RMSD改进显著

不足

  1. 复杂度增加:方法相对复杂,实现细节较多
  2. 理论分析不足:缺乏对FPE正则化收敛性的理论保证
  3. 适用范围:主要针对抗体设计,泛化到其他蛋白质设计的能力未知

影响力

该工作为计算生物学和机器学习交叉领域提供了新的研究范式,将物理定律与深度生成模型结合,对蛋白质设计、药物发现等领域具有重要意义。

适用场景

  • 治疗性抗体设计
  • 抗体工程和优化
  • 其他需要物理一致性的分子生成任务
  • 结构生物学研究

参考文献

论文引用了广泛的相关工作,包括:

  • 扩散模型基础理论(Song & Ermon 2019; Ho et al. 2020)
  • 抗体设计方法(Adolf-Bryfogle et al. 2018; Luo et al. 2022)
  • 几何深度学习(Yim et al. 2023; Bortoli et al. 2022)
  • Fokker-Planck方程应用(Lai et al. 2023)

该论文在计算抗体设计领域做出了重要贡献,通过引入物理约束显著提升了生成模型的性能和可靠性,为未来的蛋白质设计研究提供了有价值的新思路。