2025-11-11T08:22:09.471735

FP-AbDiff: Improving Score-based Antibody Design by Capturing Nonequilibrium Dynamics through the Underlying Fokker-Planck Equation

Chen, Xiong, Li et al.
Computational antibody design holds immense promise for therapeutic discovery, yet existing generative models are fundamentally limited by two core challenges: (i) a lack of dynamical consistency, which yields physically implausible structures, and (ii) poor generalization due to data scarcity and structural bias. We introduce FP-AbDiff, the first antibody generator to enforce Fokker-Planck Equation (FPE) physics along the entire generative trajectory. Our method minimizes a novel FPE residual loss over the mixed manifold of CDR geometries (R^3 x SO(3)), compelling locally-learned denoising scores to assemble into a globally coherent probability flow. This physics-informed regularizer is synergistically integrated with deep biological priors within a state-of-the-art SE(3)-equivariant diffusion framework. Rigorous evaluation on the RAbD benchmark confirms that FP-AbDiff establishes a new state-of-the-art. In de novo CDR-H3 design, it achieves a mean Root Mean Square Deviation of 0.99 Å when superposing on the variable region, a 25% improvement over the previous state-of-the-art model, AbX, and the highest reported Contact Amino Acid Recovery of 39.91%. This superiority is underscored in the more challenging six-CDR co-design task, where our model delivers consistently superior geometric precision, cutting the average full-chain Root Mean Square Deviation by ~15%, and crucially, achieves the highest full-chain Amino Acid Recovery on the functionally dominant CDR-H3 loop (45.67%). By aligning generative dynamics with physical laws, FP-AbDiff enhances robustness and generalizability, establishing a principled approach for physically faithful and functionally viable antibody design.
academic

FP-AbDiff: تحسين تصميم الأجسام المضادة القائم على النقاط من خلال التقاط الديناميكا غير المتوازنة عبر معادلة فوكر-بلانك الأساسية

المعلومات الأساسية

  • معرّف الورقة: 2511.03113
  • العنوان: FP-AbDiff: Improving Score-based Antibody Design by Capturing Nonequilibrium Dynamics through the Underlying Fokker-Planck Equation
  • المؤلفون: Jiameng Chen, Yida Xiong, Kun Li, Hongzhi Zhang, Xiantao Cai, Wenbin Hu, Jia Wu
  • التصنيف: cs.LG cs.AI q-bio.QM
  • تاريخ النشر: 5 نوفمبر 2025 (نسخة arXiv المسبقة)
  • رابط الورقة: https://arxiv.org/abs/2511.03113

الملخص

يحمل التصميم الحسابي للأجسام المضادة إمكانية هائلة في الاكتشاف العلاجي، لكن نماذج التوليد الحالية تواجه تحديين أساسيين: (i) غياب الاتساق الديناميكي، مما يؤدي إلى هياكل غير معقولة فيزيائياً؛ (ii) ضعف القدرة على التعميم بسبب ندرة البيانات والانحياز الهيكلي. تقدم هذه الورقة FP-AbDiff، وهو أول مولد أجسام مضادة يفرض قانون فيزيائي معادلة فوكر-بلانك (FPE) على كامل مسار التوليد. تقلل الطريقة خسارة بقايا FPE المبتكرة على متعدد الطيات المختلط (R³×SO(3)) لهندسة CDR، مما يجبر النقاط المزيلة للضوضاء المتعلمة محلياً على التجميع في تدفق احتمالي متسق عالمياً. يتم دمج هذا المنظم المدعوم فيزيائياً مع الأولويات البيولوجية العميقة بشكل متآزر ضمن إطار انتشار متكافئ SE(3) متقدم.

خلفية البحث والدافع

تعريف المشكلة

يواجه تصميم الأجسام المضادة تحديين رئيسيين:

  1. غياب الاتساق الديناميكي: نماذج الانتشار الحالية مثل DiffAb و AbDiffuser و AbX تحسّن الهياكل عند مستويات ضوضاء مستقلة، دون تقييد المسارات التي تربطها. تلتقط أهدافها في مطابقة النقاط المزيلة للضوضاء (DSM) التدرجات المحلية لكن تتجاهل التحولات العالمية، مما ينتج عنه في كثير من الأحيان إعادة ترتيب حلقات غير معقولة كيميائياً، وتراص جانبي غير مستقر، وتشكيلات معقدة مرهقة للطاقة.
  2. قدرة تعميم غير كافية: تؤدي مولدات الانتشار بشكل سيء خارج النطاق الضيق لمجموعات البيانات الحالية، مما يحد من قيمتها التطبيقية العملية. المعيار الرئيسي SAbDab يحتوي على أقل من 5000 مركب غير متكرر، مع انحياز شديد نحو عدد قليل من الهياكل الداعمة IgG البشرية والارتباط بالحتميات الفيروسية.

دافع البحث

تنبع خصوصية CDR والألفة من الحركات التشكيلية الدقيقة والمستمرة، وليس من لقطات هيكلية معزولة. تفتقر الطرق الحالية إلى آلية صريحة لفرض الاتساق الزمني، وغالباً ما تعود إلى الأنماط المألوفة عند مواجهة مهام خارج التوزيع (OOD).

المساهمات الأساسية

  1. إطار عمل تنظيم FPE الرائد: يقدم FP-AbDiff أول إطار انتشار لـ CDR يفرض اتساق النقاط-فوكر-بلانك على R³×SO(3)، مما يضمن تدفقاً احتمالياً متسقاً عالمياً ويلغي التحولات الحلقية غير الفيزيائية.
  2. توحيد القوانين الفيزيائية مع الأولويات البيولوجية: يوحد فيزياء فوكر-بلانك مع الأولويات التطورية والهندسية والطاقية في هدف واحد، مما يحقق توليد أجسام مضادة ديناميكي متسق وقابل للتعميم.
  3. اختراق الأداء الأفضل حالياً: يحقق أداء متقدمة في مهام تصميم وتحسين الأجسام المضادة، مع الوصول إلى 0.99 Å من RMSDFv في تصميم CDR-H3 (تحسن بنسبة 25% مقارنة بـ AbX) ومعدل استرجاع الأحماض الأمينية الملامسة بنسبة 39.91%.

شرح الطريقة

تعريف المهمة

يتم صياغة تصميم الأجسام المضادة كتوليد CDR مشروط بالسياق الهيكلي C (المستضد والإطار). يتم تعريف CDR بحالتها الحقيقية في t=0 كـ S₀=(A₀,X₀,R₀)، والتي تتضمن:

  • تسلسل الأحماض الأمينية A₀
  • إحداثيات الذرات الثقيلة X₀∈R^(Dx)
  • اتجاهات البقايا R₀∈SO(3)^(NCDR)

معمارية النموذج

نمذجة الديناميكا العشوائية

ديناميكا الترجمة (الفضاء الإقليدي): تتطور إحداثيات الهيكل العظمي Xt∈R³ عبر معادلة تفاضلية عشوائية (SDE) الحفاظ على التباين (VP):

dXt = -½βX(t)Xt dt + √βX(t) dWX,t

ديناميكا الدوران (متعدد الطيات SO(3)): يتطور اتجاه كل بقايا Ri,t∈SO(3) عبر معادلة تفاضلية عشوائية (SDE) انفجار التباين (VE):

dRi,t = √βR(t) Σ(Ri,tEa) ∘ dWᵃt

اشتقاق معادلة فوكر-بلانك

بالنسبة لـ SDE عام dx_t = f(x_t,t)dt + g(t)dW_t، تصف FPE تطور كثافة الاحتمال p(x,t):

∂p/∂t = -∇·(fp) + ½g²(t)Δp

ديناميكا الفضاء الإقليدي: يتم تعريف عامل التطور GX كـ:

GX[sX,X,t] := ½βX(t)[sX + (∇XsX)X + HX(sX)]

ديناميكا متعدد الطيات SO(3): يتم تعريف عامل التطور GR كـ:

GR[sR,R,t] := ½βR(t)[ΔBsR - 2sR + HR(sR)]

تنظيم بقايا FPE

تحويل CDR النظيف المتنبأ به من الشبكة إلى نقاط ترجمة ودوران دقيقة من خلال استدلال النقاط غير المباشر:

نقاط الترجمة:

sθ,X(Xt,t|Xθ₀) = -(Xt - αX(t)Xθ₀)/σ²X(t)

نقاط الدوران:

sθ,R(Rt,t|Rθ₀) = ∇SO(3) log pIGSO(3)((Rθ₀)ᵀRt; σ²R(t))

يتم تعريف بقايا FPE كـ:

εX(Xt,t) := ∂tsθ,X(Xt,t|Xθ₀) - GX[sθ,X,Xt,t]
εR(Rt,t) := ∂tsθ,R(Rt,t|Rθ₀) - GR[sθ,R,Rt,t]

أهداف التدريب

خسارة الدقة:

Lfid = L^X_DSM + L^R_DSM + 0.4·LCE

أولويات المعقولية البيوفيزيائية:

Lpriors = LFAPE + 0.5Ldist + 0.1LpLDDT + 0.03Lviol + 0.25Lbb

منظم الاتساق الديناميكي:

Lfpe(θ) = Et,St[w(t)(||εX||²/DX + ||εR||²/DR)]

دالة الخسارة الكاملة:

Ltotal = Lfid + It<τLpriors + 0.05·Lfpe

إعداد التجارب

مجموعات البيانات

  • مجموعة التدريب: مجموعة غير متكررة مشتقة من SAbDab (سبتمبر 2024)، مع تطابق تسلسل CDR-H3 ≤40%
  • مجموعة الاختبار: 60 مركب جسم مضاد-مستضد من معيار RAbD

مؤشرات التقييم

  • استرجاع التسلسل: AARFv و AARFull و CAAR (معدل استرجاع الأحماض الأمينية الملامسة)
  • دقة الهيكل: RMSDFv و RMSDFull و TM-score و lDDT
  • الجدوى الوظيفية: IMP (نسبة العينات ذات ∆∆G<0) و DockQ

طرق المقارنة

  • نماذج الانتشار: DiffAb و AbX
  • خطوط أنابيب موجهة الطاقة: RosettaAb
  • شبكات الرسم البياني المتكافئة: dyMEAN و MEAN
  • نماذج التسلسل الانحدارية الذاتية: HERN

نتائج التجارب

النتائج الرئيسية

مهمة تصميم CDR-H3

النموذجAAR↑TMscore↑lDDT↑CAAR↑RMSD↓DockQ↑
AbX84.90%0.99060.940739.08%1.320.429
FP-AbDiff83.65%0.99290.936339.91%0.990.444

يحقق FP-AbDiff تحسناً بنسبة 25% على RMSDFv، مع الوصول إلى دقة تحت الأنجستروم بمقدار 0.99 Å، والحصول على أعلى CAAR بنسبة 39.91%.

التصميم المتزامن لستة CDRs

في مهمة التصميم الأكثر تحدياً للموقع الكامل، يحقق FP-AbDiff أقل RMSDFull على جميع ستة CDRs، مع تقليل متوسط الخطأ الهندسي بحوالي 15% مقارنة بـ AbX، مع الوصول إلى أعلى AARFull (45.67%) على حلقة CDR-H3 الحرجة وظيفياً.

تجارب الاستئصال

متغير النموذجIMP(%)↑AAR(%)↑RMSD(Å)↓DockQ↑
+R³, +SO(3)28.4245.232.180.4443
-SO(3)35.3044.152.460.4437
-R³29.7643.142.410.4372

يحقق النموذج الكامل أعلى دقة، مع إزالة حد R³ يقلل من جودة الهيكل العظمي والواجهة، وإزالة حد SO(3) يزيد IMP لكن يسوء RMSD و AAR.

تجارب تحسين الأجسام المضادة

في التحسين المتكرر للإزالة، يتبع AbX مسار "مكسب عالي لكن هش"، بينما يحافظ FP-AbDiff من t=8 على RMSD أقل متسق و DockQ أعلى، مما يعكس مسار تحسين أكثر استقراراً.

الأعمال ذات الصلة

الطرق التقليدية

تعتمد الطرق المبكرة مثل RosettaAntibodyDesign على دوال الطاقة الإحصائية وأخذ عينات مونتي كارلو، لكنها تعاني من التكاليف الحسابية العالية وكفاءة أخذ العينات المحدودة.

طرق التعلم العميق

  • نماذج مركزة على التسلسل: تعامل نماذج لغة البروتين البروتينات كمدخلات نصية، لكنها تتجاهل الأولويات المكانية والهندسية
  • نماذج متكافئة هندسية: نماذج GNN مثل MEAN و dyMEAN والمتنبئات مثل AlphaFold2
  • نماذج الانتشار: DiffAb و AbDiffuser وغيرها، لكنها تفتقر إلى الاتساق الزمني

مزايا هذه الورقة

FP-AbDiff هو أول إطار عمل يفرض الاتساق الذاتي الفيزيائي في توليد الأجسام المضادة، مما يحل مشكلة الاتساق الديناميكي من خلال تنظيم فوكر-بلانك.

الخلاصة والمناقشة

الاستنتاجات الرئيسية

يتفوق FP-AbDiff على خطوط الأساس المتقدمة في جميع مهام التقييم في تصميم الأجسام المضادة من خلال فرض قوانين فيزياء فوكر-بلانك، مع تحقيق هياكل عالية الدقة وواجهات دقيقة ومسارات توليد مستقرة.

القيود

  1. التقريبات العددية: يعتمد تنفيذ بقايا FPE على طرق تقريبية مثل الفروقات المحدودة وخدعة Hutchinson
  2. النفقات الحسابية: على الرغم من إضافة 8% فقط من وقت التدريب، إلا أنها تتطلب عمليات انتقال أمامية إضافية
  3. التحقق التجريبي: غياب التحقق من التجارب الرطبة لوظيفة الأجسام المضادة المصممة

الاتجاهات المستقبلية

  1. تحسين الطرق التقريبية العددية لزيادة الدقة
  2. التوسع إلى مهام تصميم بروتين أخرى
  3. دمج التغذية الراجعة التجريبية لتحسين النموذج
  4. استكشاف قيود فيزيائية أكثر تعقيداً

التقييم المتعمق

المزايا

  1. الابتكار النظري: أول تطبيق لمعادلة فوكر-بلانك في تصميم الأجسام المضادة، مما يحل مشكلة الاتساق الديناميكي
  2. التقدم التقني: دمج ماهر للقوانين الفيزيائية مع التعلم العميق، مع تحقيق قيود الاتساق على متعدد الطيات المختلط R³×SO(3)
  3. التجارب الشاملة: مقارنة شاملة مع خطوط الأساس وتجارب الاستئصال والتحليل الحالات
  4. الأداء البارزة: تحقيق SOTA على مؤشرات متعددة، خاصة تحسن RMSD بنسبة 25% كبير

أوجه القصور

  1. زيادة التعقيد: الطريقة معقدة نسبياً مع تفاصيل تنفيذ كثيرة
  2. نقص التحليل النظري: غياب الضمانات النظرية لتقارب تنظيم FPE
  3. نطاق التطبيق: موجهة بشكل أساسي نحو تصميم الأجسام المضادة، مع عدم وضوح القدرة على التعميم إلى تصميم بروتين آخر

التأثير

يوفر هذا العمل نموذجاً بحثياً جديداً لمجال التقاطع بين البيولوجيا الحسابية والتعلم الآلي، مع دمج القوانين الفيزيائية مع نماذج التوليد العميقة، مما له أهمية كبيرة لمجالات تصميم البروتين واكتشاف الأدوية وغيرها.

السيناريوهات المطبقة

  • تصميم الأجسام المضادة العلاجية
  • هندسة وتحسين الأجسام المضادة
  • مهام توليد الجزيئات الأخرى التي تتطلب اتساقاً فيزيائياً
  • البحث في البيولوجيا الهيكلية

المراجع

تستشهد الورقة بأعمال ذات صلة واسعة، بما في ذلك:

  • نظرية نماذج الانتشار الأساسية (Song & Ermon 2019; Ho et al. 2020)
  • طرق تصميم الأجسام المضادة (Adolf-Bryfogle et al. 2018; Luo et al. 2022)
  • التعلم الهندسي العميق (Yim et al. 2023; Bortoli et al. 2022)
  • تطبيقات معادلة فوكر-بلانك (Lai et al. 2023)

تقدم هذه الورقة مساهمة مهمة في مجال تصميم الأجسام المضادة الحسابي، مع تحسين أداء نماذج التوليد بشكل كبير من خلال إدخال قيود فيزيائية وموثوقية، مما يوفر أفكاراً قيمة جديدة لأبحاث تصميم البروتين في المستقبل.