2025-11-11T08:22:09.471735

FP-AbDiff: Improving Score-based Antibody Design by Capturing Nonequilibrium Dynamics through the Underlying Fokker-Planck Equation

Chen, Xiong, Li et al.
Computational antibody design holds immense promise for therapeutic discovery, yet existing generative models are fundamentally limited by two core challenges: (i) a lack of dynamical consistency, which yields physically implausible structures, and (ii) poor generalization due to data scarcity and structural bias. We introduce FP-AbDiff, the first antibody generator to enforce Fokker-Planck Equation (FPE) physics along the entire generative trajectory. Our method minimizes a novel FPE residual loss over the mixed manifold of CDR geometries (R^3 x SO(3)), compelling locally-learned denoising scores to assemble into a globally coherent probability flow. This physics-informed regularizer is synergistically integrated with deep biological priors within a state-of-the-art SE(3)-equivariant diffusion framework. Rigorous evaluation on the RAbD benchmark confirms that FP-AbDiff establishes a new state-of-the-art. In de novo CDR-H3 design, it achieves a mean Root Mean Square Deviation of 0.99 Å when superposing on the variable region, a 25% improvement over the previous state-of-the-art model, AbX, and the highest reported Contact Amino Acid Recovery of 39.91%. This superiority is underscored in the more challenging six-CDR co-design task, where our model delivers consistently superior geometric precision, cutting the average full-chain Root Mean Square Deviation by ~15%, and crucially, achieves the highest full-chain Amino Acid Recovery on the functionally dominant CDR-H3 loop (45.67%). By aligning generative dynamics with physical laws, FP-AbDiff enhances robustness and generalizability, establishing a principled approach for physically faithful and functionally viable antibody design.
academic

FP-AbDiff: फोकर-प्लैंक समीकरण के माध्यम से अरैखिक गतिशीलता को कैप्चर करके स्कोर-आधारित एंटीबॉडी डिजाइन में सुधार

मूल जानकारी

  • पेपर ID: 2511.03113
  • शीर्षक: FP-AbDiff: Improving Score-based Antibody Design by Capturing Nonequilibrium Dynamics through the Underlying Fokker-Planck Equation
  • लेखक: Jiameng Chen, Yida Xiong, Kun Li, Hongzhi Zhang, Xiantao Cai, Wenbin Hu, Jia Wu
  • वर्गीकरण: cs.LG cs.AI q-bio.QM
  • प्रकाशन तिथि: 5 नवंबर 2025 (arXiv प्रीप्रिंट)
  • पेपर लिंक: https://arxiv.org/abs/2511.03113

सारांश

कम्प्यूटेशनल एंटीबॉडी डिजाइन चिकित्सीय खोज में विशाल संभावना रखता है, लेकिन मौजूदा जनरेटिव मॉडल दो मूल चुनौतियों से सीमित हैं: (i) गतिशीलता संगति की कमी, जिससे भौतिकी की दृष्टि से अनुचित संरचनाएं बनती हैं; (ii) डेटा की कमी और संरचनात्मक पूर्वाग्रह के कारण सामान्यीकरण क्षमता में कमी। यह पेपर FP-AbDiff प्रस्तुत करता है, जो पहला एंटीबॉडी जनरेटर है जो संपूर्ण जनरेटिव ट्रैजेक्टरी पर फोकर-प्लैंक समीकरण (FPE) भौतिक नियम को लागू करता है। यह विधि CDR ज्यामिति के मिश्रित मैनिफोल्ड (R³×SO(3)) पर एक नई FPE अवशेष हानि को न्यूनतम करती है, जो स्थानीय रूप से सीखे गए डीनोइजिंग स्कोर को वैश्विक रूप से सुसंगत संभाव्यता प्रवाह में संयोजित करती है। यह भौतिकी-सूचित नियमितकारी SE(3) समतुल्य विसरण ढांचे के भीतर गहरी जैविक पूर्वधारणा के साथ सहक्रियात्मक रूप से एकीकृत है।

अनुसंधान पृष्ठभूमि और प्रेरणा

समस्या परिभाषा

एंटीबॉडी डिजाइन दो महत्वपूर्ण चुनौतियों का सामना करता है:

  1. गतिशीलता संगति की कमी: मौजूदा विसरण मॉडल जैसे DiffAb, AbDiffuser और AbX स्वतंत्र शोर स्तरों की संरचनाओं को अनुकूलित करते हैं, लेकिन कभी भी उन्हें जोड़ने वाले पथों को सीमित नहीं करते। उनके डीनोइजिंग स्कोर मिलान (DSM) उद्देश्य स्थानीय ढाल को कैप्चर करते हैं लेकिन वैश्विक परिवर्तन को नजरअंदाज करते हैं, अक्सर रासायनिक रूप से अनुचित लूप पुनर्व्यवस्था, अस्थिर साइड-चेन स्टैकिंग और ऊर्जा-तनावपूर्ण अनुरूपताएं उत्पन्न करते हैं।
  2. सामान्यीकरण क्षमता में कमी: विसरण जनरेटर वर्तमान डेटासेट की संकीर्ण सीमा के बाहर खराब प्रदर्शन करते हैं, जिससे उनका व्यावहारिक अनुप्रयोग मूल्य सीमित होता है। मुख्य बेंचमार्क SAbDab में 5000 से कम गैर-अनावश्यक परिसर हैं और कुछ मानव IgG स्कैफोल्ड और वायरल एपिटोप बाइंडिंग की ओर गंभीर पूर्वाग्रह है।

अनुसंधान प्रेरणा

CDR विशिष्टता और आत्मीयता सूक्ष्म, निरंतर अनुरूपता गतिविधियों से आती है, न कि अलग-अलग संरचना स्नैपशॉट से। मौजूदा विधियों में समय संगति को लागू करने के लिए स्पष्ट तंत्र की कमी है, और वितरण-बाहर (OOD) कार्यों का सामना करते समय अक्सर परिचित पैटर्न पर वापस आते हैं।

मुख्य योगदान

  1. पहला FPE नियमितकरण ढांचा: FP-AbDiff CDR के लिए पहला विसरण ढांचा प्रस्तुत करता है जो R³×SO(3) पर स्कोर-फोकर-प्लैंक संगति को लागू करता है, वैश्विक रूप से सुसंगत संभाव्यता प्रवाह सुनिश्चित करता है और गैर-भौतिक लूप परिवर्तन को समाप्त करता है।
  2. भौतिक नियम और जैविक पूर्वधारणा का एकीकरण: फोकर-प्लैंक भौतिकी को विकासवादी, ज्यामितीय और ऊर्जा पूर्वधारणा के साथ एक एकल उद्देश्य में एकीकृत करता है, गतिशील रूप से सुसंगत और सामान्यीकरणीय एंटीबॉडी जनरेशन प्राप्त करता है।
  3. SOTA प्रदर्शन सफलता: एंटीबॉडी डिजाइन और अनुकूलन कार्यों पर अत्याधुनिक प्रदर्शन प्राप्त करता है, CDR-H3 डिजाइन में 0.99 Å की RMSDFv (AbX की तुलना में 25% सुधार) और 39.91% संपर्क अमीनो एसिड पुनः प्राप्ति दर प्राप्त करता है।

विधि विवरण

कार्य परिभाषा

एंटीबॉडी डिजाइन को संरचनात्मक संदर्भ C (एंटीजन और फ्रेमवर्क) दिए गए CDR की सशर्त जनरेशन के रूप में तैयार किया जाता है। CDR को t=0 पर इसकी वास्तविक स्थिति S₀=(A₀,X₀,R₀) द्वारा परिभाषित किया जाता है, जिसमें शामिल हैं:

  • अमीनो एसिड अनुक्रम A₀
  • भारी परमाणु निर्देशांक X₀∈R^(Dx)
  • अवशेष अभिविन्यास R₀∈SO(3)^(NCDR)

मॉडल आर्किटेक्चर

स्टोकेस्टिक गतिशीलता मॉडलिंग

अनुवाद गतिशीलता (यूक्लिडियन स्पेस): कंकाल निर्देशांक Xt∈R³ विचरण-संरक्षण (VP) SDE के माध्यम से विकसित होते हैं:

dXt = -½βX(t)Xt dt + √βX(t) dWX,t

घूर्णन गतिशीलता (SO(3) मैनिफोल्ड): प्रत्येक अवशेष का अभिविन्यास Ri,t∈SO(3) विचरण-विस्फोट (VE) SDE के माध्यम से विकसित होता है:

dRi,t = √βR(t) Σ(Ri,tEa) ∘ dWᵃt

फोकर-प्लैंक समीकरण व्युत्पत्ति

सामान्य SDE dx_t = f(x_t,t)dt + g(t)dW_t के लिए, FPE संभाव्यता घनत्व p(x,t) के विकास का वर्णन करता है:

∂p/∂t = -∇·(fp) + ½g²(t)Δp

यूक्लिडियन स्पेस गतिशीलता: विकास ऑपरेटर GX को परिभाषित किया जाता है:

GX[sX,X,t] := ½βX(t)[sX + (∇XsX)X + HX(sX)]

SO(3) मैनिफोल्ड गतिशीलता: विकास ऑपरेटर GR को परिभाषित किया जाता है:

GR[sR,R,t] := ½βR(t)[ΔBsR - 2sR + HR(sR)]

FPE अवशेष नियमितकरण

नेटवर्क द्वारा अनुमानित स्वच्छ CDR को सटीक अनुवाद और घूर्णन स्कोर में परिवर्तित करना:

अनुवाद स्कोर:

sθ,X(Xt,t|Xθ₀) = -(Xt - αX(t)Xθ₀)/σ²X(t)

घूर्णन स्कोर:

sθ,R(Rt,t|Rθ₀) = ∇SO(3) log pIGSO(3)((Rθ₀)ᵀRt; σ²R(t))

FPE अवशेष को परिभाषित किया जाता है:

εX(Xt,t) := ∂tsθ,X(Xt,t|Xθ₀) - GX[sθ,X,Xt,t]
εR(Rt,t) := ∂tsθ,R(Rt,t|Rθ₀) - GR[sθ,R,Rt,t]

प्रशिक्षण उद्देश्य

विश्वसनीयता हानि:

Lfid = L^X_DSM + L^R_DSM + 0.4·LCE

जैव-भौतिक तर्कसंगतता पूर्वधारणा:

Lpriors = LFAPE + 0.5Ldist + 0.1LpLDDT + 0.03Lviol + 0.25Lbb

गतिशीलता संगति नियमितकारी:

Lfpe(θ) = Et,St[w(t)(||εX||²/DX + ||εR||²/DR)]

संपूर्ण हानि फलन:

Ltotal = Lfid + It<τLpriors + 0.05·Lfpe

प्रायोगिक सेटअप

डेटासेट

  • प्रशिक्षण सेट: SAbDab-व्युत्पन्न गैर-अनावश्यक सेट (सितंबर 2024), CDR-H3 अनुक्रम पहचान ≤40%
  • परीक्षण सेट: RAbD बेंचमार्क के 60 एंटीबॉडी-एंटीजन परिसर

मूल्यांकन मेट्रिक्स

  • अनुक्रम पुनः प्राप्ति: AARFv, AARFull, CAAR (संपर्क अमीनो एसिड पुनः प्राप्ति दर)
  • संरचनात्मक सटीकता: RMSDFv, RMSDFull, TM-score, lDDT
  • कार्यात्मक व्यवहार्यता: IMP (∆∆G<0 के नमूनों का प्रतिशत), DockQ

तुलनात्मक विधियां

  • विसरण मॉडल: DiffAb, AbX
  • ऊर्जा-निर्देशित पाइपलाइन: RosettaAb
  • समतुल्य GNN: dyMEAN, MEAN
  • स्वत: प्रतिगामी अनुक्रम मॉडल: HERN

प्रायोगिक परिणाम

मुख्य परिणाम

CDR-H3 डिजाइन कार्य

मॉडलAAR↑TMscore↑lDDT↑CAAR↑RMSD↓DockQ↑
AbX84.90%0.99060.940739.08%1.320.429
FP-AbDiff83.65%0.99290.936339.91%0.990.444

FP-AbDiff RMSDFv पर 25% सुधार प्राप्त करता है, 0.99 Å की सब-एंगस्ट्रॉम सटीकता प्राप्त करता है, और 39.91% की सर्वोच्च CAAR प्राप्त करता है।

छह CDR सहक्रिया डिजाइन

अधिक चुनौतीपूर्ण संपूर्ण एपिटोप डिजाइन कार्य में, FP-AbDiff सभी छह CDR पर सबसे कम RMSDFull प्राप्त करता है, AbX की तुलना में औसत ज्यामितीय त्रुटि में लगभग 15% की कमी, कार्यात्मक रूप से महत्वपूर्ण CDR-H3 लूप पर सर्वोच्च AARFull (45.67%) प्राप्त करता है।

विलोपन प्रयोग

मॉडल वेरिएंटIMP(%)↑AAR(%)↑RMSD(Å)↓DockQ↑
+R³, +SO(3)28.4245.232.180.4443
-SO(3)35.3044.152.460.4437
-R³29.7643.142.410.4372

संपूर्ण मॉडल सर्वोच्च विश्वसनीयता प्राप्त करता है, R³ पद को हटाने से कंकाल और इंटरफेस गुणवत्ता में कमी आती है, SO(3) पद को हटाने से IMP में वृद्धि होती है लेकिन RMSD और AAR खराब होते हैं।

एंटीबॉडी अनुकूलन प्रयोग

पुनरावृत्तीय डीनोइजिंग अनुकूलन में, AbX "उच्च लाभ लेकिन नाजुक" प्रक्षेपवक्र का पालन करता है, जबकि FP-AbDiff t=8 से शुरू करके सुसंगत कम RMSD और उच्च DockQ बनाए रखता है, अधिक स्थिर अनुकूलन पथ को दर्शाता है।

संबंधित कार्य

पारंपरिक विधियां

RosettaAntibodyDesign जैसी प्रारंभिक विधियां सांख्यिकीय ऊर्जा कार्यों और मोंटे कार्लो नमूनाकरण पर निर्भर करती हैं, लेकिन उच्च कम्प्यूटेशनल लागत और सीमित नमूनाकरण दक्षता से सीमित हैं।

गहन शिक्षा विधियां

  • अनुक्रम-केंद्रित मॉडल: प्रोटीन भाषा मॉडल प्रोटीन को पाठ इनपुट के रूप में मानते हैं, लेकिन स्थानिक और ज्यामितीय पूर्वधारणा को नजरअंदाज करते हैं
  • ज्यामितीय समतुल्य मॉडल: MEAN, dyMEAN आदि GNN मॉडल और AlphaFold2 जैसे भविष्यवक्ता
  • विसरण मॉडल: DiffAb, AbDiffuser आदि, लेकिन समय संगति की कमी

इस पेपर के लाभ

FP-AbDiff एंटीबॉडी जनरेशन में भौतिक स्व-संगति लागू करने वाला पहला ढांचा है, फोकर-प्लैंक नियमितकरण के माध्यम से गतिशीलता संगति समस्या को हल करता है।

निष्कर्ष और चर्चा

मुख्य निष्कर्ष

FP-AbDiff फोकर-प्लैंक भौतिक नियम को लागू करके एंटीबॉडी डिजाइन के सभी मूल्यांकन कार्यों में लगातार अत्याधुनिक आधारभूत से बेहतर प्रदर्शन करता है, उच्च विश्वसनीयता संरचना, सटीक इंटरफेस और स्थिर जनरेटिव प्रक्षेपवक्र प्राप्त करता है।

सीमाएं

  1. संख्यात्मक सन्निकटन: FPE अवशेष का कार्यान्वयन परिमित अंतर और Hutchinson तकनीक जैसे सन्निकटन विधियों पर निर्भर करता है
  2. कम्प्यूटेशनल ओवरहेड: हालांकि प्रशिक्षण समय में केवल 8% की वृद्धि होती है, लेकिन अतिरिक्त फॉरवर्ड प्रोपेगेशन की आवश्यकता होती है
  3. प्रायोगिक सत्यापन: डिजाइन किए गए एंटीबॉडी की कार्यात्मकता के गीले प्रयोग सत्यापन की कमी

भविष्य की दिशाएं

  1. सटीकता में सुधार के लिए संख्यात्मक सन्निकटन विधियों में सुधार
  2. अन्य प्रोटीन डिजाइन कार्यों तक विस्तार
  3. मॉडल अनुकूलन के लिए प्रायोगिक प्रतिक्रिया को एकीकृत करना
  4. अधिक जटिल भौतिक बाधाओं की खोज

गहन मूल्यांकन

शक्तियां

  1. सैद्धांतिक नवाचार: पहली बार फोकर-प्लैंक समीकरण को एंटीबॉडी डिजाइन में पेश करना, गतिशीलता संगति समस्या को हल करना
  2. तकनीकी उन्नति: भौतिक नियमों को गहन शिक्षा के साथ चतुराई से संयोजित करना, मिश्रित मैनिफोल्ड R³×SO(3) पर संगति बाधा को लागू करना
  3. पर्याप्त प्रयोग: व्यापक आधारभूत तुलना, विलोपन प्रयोग और केस विश्लेषण
  4. उत्कृष्ट प्रदर्शन: कई मेट्रिक्स पर SOTA प्राप्त करना, विशेष रूप से 25% RMSD सुधार महत्वपूर्ण है

कमियां

  1. जटिलता में वृद्धि: विधि अपेक्षाकृत जटिल है, कार्यान्वयन विवरण अधिक हैं
  2. सैद्धांतिक विश्लेषण अपर्याप्त: FPE नियमितकरण अभिसरण के लिए सैद्धांतिक गारंटी की कमी
  3. लागू सीमा: मुख्य रूप से एंटीबॉडी डिजाइन पर केंद्रित, अन्य प्रोटीन डिजाइन कार्यों में सामान्यीकरण की क्षमता अज्ञात है

प्रभाव

यह कार्य कम्प्यूटेशनल जीव विज्ञान और मशीन लर्निंग के अंतर-विषयक क्षेत्र के लिए एक नया अनुसंधान प्रतिमान प्रदान करता है, भौतिक नियमों को गहरे जनरेटिव मॉडल के साथ संयोजित करता है, जो प्रोटीन डिजाइन, दवा खोज आदि क्षेत्रों के लिए महत्वपूर्ण है।

लागू परिदृश्य

  • चिकित्सीय एंटीबॉडी डिजाइन
  • एंटीबॉडी इंजीनियरिंग और अनुकूलन
  • अन्य कार्य जिन्हें भौतिक संगति की आवश्यकता है
  • संरचनात्मक जीव विज्ञान अनुसंधान

संदर्भ

पेपर व्यापक संबंधित कार्यों का हवाला देता है, जिसमें शामिल हैं:

  • विसरण मॉडल मूल सिद्धांत (Song & Ermon 2019; Ho et al. 2020)
  • एंटीबॉडी डिजाइन विधियां (Adolf-Bryfogle et al. 2018; Luo et al. 2022)
  • ज्यामितीय गहन शिक्षा (Yim et al. 2023; Bortoli et al. 2022)
  • फोकर-प्लैंक समीकरण अनुप्रयोग (Lai et al. 2023)

यह पेपर कम्प्यूटेशनल एंटीबॉडी डिजाइन क्षेत्र में महत्वपूर्ण योगदान देता है, भौतिक बाधाओं को पेश करके जनरेटिव मॉडल के प्रदर्शन और विश्वसनीयता में उल्लेखनीय सुधार करता है, भविष्य के प्रोटीन डिजाइन अनुसंधान के लिए मूल्यवान नई अंतर्दृष्टि प्रदान करता है।