2025-11-11T08:22:09.471735

FP-AbDiff: Improving Score-based Antibody Design by Capturing Nonequilibrium Dynamics through the Underlying Fokker-Planck Equation

Chen, Xiong, Li et al.

Computational antibody design holds immense promise for therapeutic discovery, yet existing generative models are fundamentally limited by two core challenges: (i) a lack of dynamical consistency, which yields physically implausible structures, and (ii) poor generalization due to data scarcity and structural bias. We introduce FP-AbDiff, the first antibody generator to enforce Fokker-Planck Equation (FPE) physics along the entire generative trajectory. Our method minimizes a novel FPE residual loss over the mixed manifold of CDR geometries (R^3 x SO(3)), compelling locally-learned denoising scores to assemble into a globally coherent probability flow. This physics-informed regularizer is synergistically integrated with deep biological priors within a state-of-the-art SE(3)-equivariant diffusion framework. Rigorous evaluation on the RAbD benchmark confirms that FP-AbDiff establishes a new state-of-the-art. In de novo CDR-H3 design, it achieves a mean Root Mean Square Deviation of 0.99 Ã when superposing on the variable region, a 25% improvement over the previous state-of-the-art model, AbX, and the highest reported Contact Amino Acid Recovery of 39.91%. This superiority is underscored in the more challenging six-CDR co-design task, where our model delivers consistently superior geometric precision, cutting the average full-chain Root Mean Square Deviation by ~15%, and crucially, achieves the highest full-chain Amino Acid Recovery on the functionally dominant CDR-H3 loop (45.67%). By aligning generative dynamics with physical laws, FP-AbDiff enhances robustness and generalizability, establishing a principled approach for physically faithful and functionally viable antibody design.

academic

FP-AbDiff: Improving Score-based Antibody Design by Capturing Nonequilibrium Dynamics through the Underlying Fokker-Planck Equation

基本信息

论文ID: 2511.03113
标题: FP-AbDiff: Improving Score-based Antibody Design by Capturing Nonequilibrium Dynamics through the Underlying Fokker-Planck Equation
作者: Jiameng Chen, Yida Xiong, Kun Li, Hongzhi Zhang, Xiantao Cai, Wenbin Hu, Jia Wu
分类: cs.LG cs.AI q-bio.QM
发表时间: 2025年11月5日（arXiv预印本）
论文链接: https://arxiv.org/abs/2511.03113

摘要

计算抗体设计在治疗性发现方面具有巨大潜力，但现有生成模型受到两个核心挑战的根本限制：(i) 缺乏动力学一致性，导致物理上不合理的结构；(ii) 由于数据稀缺和结构偏差导致的泛化能力差。本文引入FP-AbDiff，这是第一个在整个生成轨迹上强制执行Fokker-Planck方程(FPE)物理定律的抗体生成器。该方法在CDR几何的混合流形(R³×SO(3))上最小化新颖的FPE残差损失，迫使局部学习的去噪分数组装成全局一致的概率流。这种物理信息正则化器与深度生物先验在最先进的SE(3)等变扩散框架内协同集成。

研究背景与动机

问题定义

抗体设计面临两个关键挑战：

动力学一致性缺失：现有扩散模型如DiffAb、AbDiffuser和AbX优化独立噪声水平的结构，从不约束连接它们的路径。它们的去噪分数匹配(DSM)目标捕获局部梯度但忽略全局转换，经常产生化学上不合理的环重排、不稳定的侧链堆积和能量紧张的构象体。
泛化能力不足：扩散生成器在当前数据集的狭窄范围外表现不佳，限制了其实际应用价值。主要基准SAbDab包含少于5000个非冗余复合物，且严重偏向少数人类IgG支架与病毒表位结合。

研究动机

CDR特异性和亲和力来自微妙的、连续的构象运动，而不是孤立的结构快照。现有方法缺乏明确的机制来强制时间一致性，且在面对分布外(OOD)任务时经常回退到熟悉的模式。

核心贡献

首创FPE正则化框架：FP-AbDiff引入了首个针对CDR的扩散框架，在R³×SO(3)上强制执行分数-Fokker-Planck一致性，确保全局一致的概率流并消除非物理环转换。
物理定律与生物先验统一：将Fokker-Planck物理学与进化、几何和能量先验统一到单一目标中，实现动力学一致和可泛化的抗体生成。
SOTA性能突破：在抗体设计和优化任务上实现最先进性能，在CDR-H3设计中达到0.99 Å的RMSDFv（比AbX改进25%）和39.91%的接触氨基酸恢复率。

方法详解

任务定义

抗体设计被表述为给定结构上下文C（抗原和框架）的条件CDR生成。CDR由其在t=0时的真实状态S₀=(A₀,X₀,R₀)定义，包括：

氨基酸序列A₀
重原子坐标X₀∈R^(Dx)
残基方向R₀∈SO(3)^(NCDR)

模型架构

随机动力学建模

平移动力学（欧几里得空间）：骨架坐标Xt∈R³通过方差保持(VP) SDE演化：

dXt = -½βX(t)Xt dt + √βX(t) dWX,t

旋转动力学（SO(3)流形）：每个残基的方向Ri,t∈SO(3)通过方差爆炸(VE) SDE演化：

dRi,t = √βR(t) Σ(Ri,tEa) ∘ dWᵃt

Fokker-Planck方程推导

对于一般SDE dx_t = f(x_t,t)dt + g(t)dW_t，FPE描述概率密度p(x,t)的演化：

∂p/∂t = -∇·(fp) + ½g²(t)Δp

欧几里得空间动力学：演化算子GX定义为：

GX[sX,X,t] := ½βX(t)[sX + (∇XsX)X + HX(sX)]

SO(3)流形动力学：演化算子GR定义为：

GR[sR,R,t] := ½βR(t)[ΔBsR - 2sR + HR(sR)]

FPE残差正则化

通过间接分数推断将网络预测的清洁CDR转换为精确的平移和旋转分数：

平移分数：

sθ,X(Xt,t|Xθ₀) = -(Xt - αX(t)Xθ₀)/σ²X(t)

旋转分数：

sθ,R(Rt,t|Rθ₀) = ∇SO(3) log pIGSO(3)((Rθ₀)ᵀRt; σ²R(t))

FPE残差定义为：

εX(Xt,t) := ∂tsθ,X(Xt,t|Xθ₀) - GX[sθ,X,Xt,t]
εR(Rt,t) := ∂tsθ,R(Rt,t|Rθ₀) - GR[sθ,R,Rt,t]

训练目标

保真度损失：

Lfid = L^X_DSM + L^R_DSM + 0.4·LCE

生物物理合理性先验：

Lpriors = LFAPE + 0.5Ldist + 0.1LpLDDT + 0.03Lviol + 0.25Lbb

动力学一致性正则化器：

Lfpe(θ) = Et,St[w(t)(||εX||²/DX + ||εR||²/DR)]

完整损失函数：

Ltotal = Lfid + It<τLpriors + 0.05·Lfpe

实验设置

数据集

训练集：基于SAbDab衍生的非冗余集合（2024年9月），CDR-H3序列同一性≤40%
测试集：RAbD基准的60个抗体-抗原复合物

评价指标

序列恢复：AARFv、AARFull、CAAR（接触氨基酸恢复率）
结构精度：RMSDFv、RMSDFull、TM-score、lDDT
功能可行性：IMP（∆∆G<0的样本百分比）、DockQ

对比方法

扩散模型：DiffAb、AbX
能量引导管道：RosettaAb
等变GNN：dyMEAN、MEAN
自回归序列模型：HERN

实验结果

主要结果

CDR-H3设计任务

模型	AAR↑	TMscore↑	lDDT↑	CAAR↑	RMSD↓	DockQ↑
AbX	84.90%	0.9906	0.9407	39.08%	1.32	0.429
FP-AbDiff	83.65%	0.9929	0.9363	39.91%	0.99	0.444

FP-AbDiff在RMSDFv上实现25%的改进，达到亚埃级精度0.99 Å，并获得最高的CAAR 39.91%。

六CDR协同设计

在更具挑战性的全副位点设计任务中，FP-AbDiff在所有六个CDR上都实现了最低的RMSDFull，平均几何误差比AbX降低约15%，在功能关键的CDR-H3环上达到最高的AARFull（45.67%）。

消融实验

模型变体	IMP(%)↑	AAR(%)↑	RMSD(Å)↓	DockQ↑
+R³, +SO(3)	28.42	45.23	2.18	0.4443
-SO(3)	35.30	44.15	2.46	0.4437
-R³	29.76	43.14	2.41	0.4372

完整模型实现最高保真度，移除R³项会降低骨架和界面质量，移除SO(3)项虽然IMP增加但RMSD和AAR变差。

数值近似：FPE残差的实现依赖有限差分和Hutchinson技巧等近似方法
计算开销：虽然只增加8%的训练时间，但仍需额外的前向传播
实验验证：缺乏湿实验验证设计抗体的功能性

未来方向

改进数值近似方法提高精度
扩展到其他蛋白质设计任务
结合实验反馈进行模型优化
探索更复杂的物理约束

深度评价

优点

理论创新：首次将Fokker-Planck方程引入抗体设计，解决动力学一致性问题
技术先进：巧妙结合物理定律与深度学习，在混合流形R³×SO(3)上实现一致性约束
实验充分：全面的基线对比、消融实验和案例分析
性能突出：在多个指标上达到SOTA，特别是25%的RMSD改进显著

不足

复杂度增加：方法相对复杂，实现细节较多
理论分析不足：缺乏对FPE正则化收敛性的理论保证
适用范围：主要针对抗体设计，泛化到其他蛋白质设计的能力未知

影响力

该工作为计算生物学和机器学习交叉领域提供了新的研究范式，将物理定律与深度生成模型结合，对蛋白质设计、药物发现等领域具有重要意义。

适用场景

治疗性抗体设计
抗体工程和优化
其他需要物理一致性的分子生成任务
结构生物学研究

参考文献

论文引用了广泛的相关工作，包括：

扩散模型基础理论（Song & Ermon 2019; Ho et al. 2020）
抗体设计方法（Adolf-Bryfogle et al. 2018; Luo et al. 2022）
几何深度学习（Yim et al. 2023; Bortoli et al. 2022）
Fokker-Planck方程应用（Lai et al. 2023）

该论文在计算抗体设计领域做出了重要贡献，通过引入物理约束显著提升了生成模型的性能和可靠性，为未来的蛋白质设计研究提供了有价值的新思路。

FP-AbDiff: Improving Score-based Antibody Design by Capturing Nonequilibrium Dynamics through the Underlying Fokker-Planck Equation

FP-AbDiff: Improving Score-based Antibody Design by Capturing Nonequilibrium Dynamics through the Underlying Fokker-Planck Equation

基本信息

摘要

研究背景与动机

问题定义

研究动机

核心贡献

方法详解

任务定义

模型架构

随机动力学建模

Fokker-Planck方程推导

FPE残差正则化

训练目标

实验设置

数据集

评价指标

对比方法

实验结果

主要结果

CDR-H3设计任务

六CDR协同设计

消融实验

抗体优化实验

相关工作

传统方法

深度学习方法

本文优势

结论与讨论

主要结论

局限性

未来方向

深度评价

优点

不足

影响力

适用场景

参考文献