FP-AbDiff: Improving Score-based Antibody Design by Capturing Nonequilibrium Dynamics through the Underlying Fokker-Planck Equation
Chen, Xiong, Li et al.
Computational antibody design holds immense promise for therapeutic discovery, yet existing generative models are fundamentally limited by two core challenges: (i) a lack of dynamical consistency, which yields physically implausible structures, and (ii) poor generalization due to data scarcity and structural bias. We introduce FP-AbDiff, the first antibody generator to enforce Fokker-Planck Equation (FPE) physics along the entire generative trajectory. Our method minimizes a novel FPE residual loss over the mixed manifold of CDR geometries (R^3 x SO(3)), compelling locally-learned denoising scores to assemble into a globally coherent probability flow. This physics-informed regularizer is synergistically integrated with deep biological priors within a state-of-the-art SE(3)-equivariant diffusion framework. Rigorous evaluation on the RAbD benchmark confirms that FP-AbDiff establishes a new state-of-the-art. In de novo CDR-H3 design, it achieves a mean Root Mean Square Deviation of 0.99 Ã when superposing on the variable region, a 25% improvement over the previous state-of-the-art model, AbX, and the highest reported Contact Amino Acid Recovery of 39.91%. This superiority is underscored in the more challenging six-CDR co-design task, where our model delivers consistently superior geometric precision, cutting the average full-chain Root Mean Square Deviation by ~15%, and crucially, achieves the highest full-chain Amino Acid Recovery on the functionally dominant CDR-H3 loop (45.67%). By aligning generative dynamics with physical laws, FP-AbDiff enhances robustness and generalizability, establishing a principled approach for physically faithful and functionally viable antibody design.
academic
FP-AbDiff: تحسين تصميم الأجسام المضادة القائم على النقاط من خلال التقاط الديناميكا غير المتوازنة عبر معادلة فوكر-بلانك الأساسية
يحمل التصميم الحسابي للأجسام المضادة إمكانية هائلة في الاكتشاف العلاجي، لكن نماذج التوليد الحالية تواجه تحديين أساسيين: (i) غياب الاتساق الديناميكي، مما يؤدي إلى هياكل غير معقولة فيزيائياً؛ (ii) ضعف القدرة على التعميم بسبب ندرة البيانات والانحياز الهيكلي. تقدم هذه الورقة FP-AbDiff، وهو أول مولد أجسام مضادة يفرض قانون فيزيائي معادلة فوكر-بلانك (FPE) على كامل مسار التوليد. تقلل الطريقة خسارة بقايا FPE المبتكرة على متعدد الطيات المختلط (R³×SO(3)) لهندسة CDR، مما يجبر النقاط المزيلة للضوضاء المتعلمة محلياً على التجميع في تدفق احتمالي متسق عالمياً. يتم دمج هذا المنظم المدعوم فيزيائياً مع الأولويات البيولوجية العميقة بشكل متآزر ضمن إطار انتشار متكافئ SE(3) متقدم.
غياب الاتساق الديناميكي: نماذج الانتشار الحالية مثل DiffAb و AbDiffuser و AbX تحسّن الهياكل عند مستويات ضوضاء مستقلة، دون تقييد المسارات التي تربطها. تلتقط أهدافها في مطابقة النقاط المزيلة للضوضاء (DSM) التدرجات المحلية لكن تتجاهل التحولات العالمية، مما ينتج عنه في كثير من الأحيان إعادة ترتيب حلقات غير معقولة كيميائياً، وتراص جانبي غير مستقر، وتشكيلات معقدة مرهقة للطاقة.
قدرة تعميم غير كافية: تؤدي مولدات الانتشار بشكل سيء خارج النطاق الضيق لمجموعات البيانات الحالية، مما يحد من قيمتها التطبيقية العملية. المعيار الرئيسي SAbDab يحتوي على أقل من 5000 مركب غير متكرر، مع انحياز شديد نحو عدد قليل من الهياكل الداعمة IgG البشرية والارتباط بالحتميات الفيروسية.
تنبع خصوصية CDR والألفة من الحركات التشكيلية الدقيقة والمستمرة، وليس من لقطات هيكلية معزولة. تفتقر الطرق الحالية إلى آلية صريحة لفرض الاتساق الزمني، وغالباً ما تعود إلى الأنماط المألوفة عند مواجهة مهام خارج التوزيع (OOD).
إطار عمل تنظيم FPE الرائد: يقدم FP-AbDiff أول إطار انتشار لـ CDR يفرض اتساق النقاط-فوكر-بلانك على R³×SO(3)، مما يضمن تدفقاً احتمالياً متسقاً عالمياً ويلغي التحولات الحلقية غير الفيزيائية.
توحيد القوانين الفيزيائية مع الأولويات البيولوجية: يوحد فيزياء فوكر-بلانك مع الأولويات التطورية والهندسية والطاقية في هدف واحد، مما يحقق توليد أجسام مضادة ديناميكي متسق وقابل للتعميم.
اختراق الأداء الأفضل حالياً: يحقق أداء متقدمة في مهام تصميم وتحسين الأجسام المضادة، مع الوصول إلى 0.99 Å من RMSDFv في تصميم CDR-H3 (تحسن بنسبة 25% مقارنة بـ AbX) ومعدل استرجاع الأحماض الأمينية الملامسة بنسبة 39.91%.
يتم صياغة تصميم الأجسام المضادة كتوليد CDR مشروط بالسياق الهيكلي C (المستضد والإطار). يتم تعريف CDR بحالتها الحقيقية في t=0 كـ S₀=(A₀,X₀,R₀)، والتي تتضمن:
في مهمة التصميم الأكثر تحدياً للموقع الكامل، يحقق FP-AbDiff أقل RMSDFull على جميع ستة CDRs، مع تقليل متوسط الخطأ الهندسي بحوالي 15% مقارنة بـ AbX، مع الوصول إلى أعلى AARFull (45.67%) على حلقة CDR-H3 الحرجة وظيفياً.
في التحسين المتكرر للإزالة، يتبع AbX مسار "مكسب عالي لكن هش"، بينما يحافظ FP-AbDiff من t=8 على RMSD أقل متسق و DockQ أعلى، مما يعكس مسار تحسين أكثر استقراراً.
تعتمد الطرق المبكرة مثل RosettaAntibodyDesign على دوال الطاقة الإحصائية وأخذ عينات مونتي كارلو، لكنها تعاني من التكاليف الحسابية العالية وكفاءة أخذ العينات المحدودة.
يتفوق FP-AbDiff على خطوط الأساس المتقدمة في جميع مهام التقييم في تصميم الأجسام المضادة من خلال فرض قوانين فيزياء فوكر-بلانك، مع تحقيق هياكل عالية الدقة وواجهات دقيقة ومسارات توليد مستقرة.
يوفر هذا العمل نموذجاً بحثياً جديداً لمجال التقاطع بين البيولوجيا الحسابية والتعلم الآلي، مع دمج القوانين الفيزيائية مع نماذج التوليد العميقة، مما له أهمية كبيرة لمجالات تصميم البروتين واكتشاف الأدوية وغيرها.
نظرية نماذج الانتشار الأساسية (Song & Ermon 2019; Ho et al. 2020)
طرق تصميم الأجسام المضادة (Adolf-Bryfogle et al. 2018; Luo et al. 2022)
التعلم الهندسي العميق (Yim et al. 2023; Bortoli et al. 2022)
تطبيقات معادلة فوكر-بلانك (Lai et al. 2023)
تقدم هذه الورقة مساهمة مهمة في مجال تصميم الأجسام المضادة الحسابي، مع تحسين أداء نماذج التوليد بشكل كبير من خلال إدخال قيود فيزيائية وموثوقية، مما يوفر أفكاراً قيمة جديدة لأبحاث تصميم البروتين في المستقبل.