FP-AbDiff: Improving Score-based Antibody Design by Capturing Nonequilibrium Dynamics through the Underlying Fokker-Planck Equation
Chen, Xiong, Li et al.
Computational antibody design holds immense promise for therapeutic discovery, yet existing generative models are fundamentally limited by two core challenges: (i) a lack of dynamical consistency, which yields physically implausible structures, and (ii) poor generalization due to data scarcity and structural bias. We introduce FP-AbDiff, the first antibody generator to enforce Fokker-Planck Equation (FPE) physics along the entire generative trajectory. Our method minimizes a novel FPE residual loss over the mixed manifold of CDR geometries (R^3 x SO(3)), compelling locally-learned denoising scores to assemble into a globally coherent probability flow. This physics-informed regularizer is synergistically integrated with deep biological priors within a state-of-the-art SE(3)-equivariant diffusion framework. Rigorous evaluation on the RAbD benchmark confirms that FP-AbDiff establishes a new state-of-the-art. In de novo CDR-H3 design, it achieves a mean Root Mean Square Deviation of 0.99 Ã when superposing on the variable region, a 25% improvement over the previous state-of-the-art model, AbX, and the highest reported Contact Amino Acid Recovery of 39.91%. This superiority is underscored in the more challenging six-CDR co-design task, where our model delivers consistently superior geometric precision, cutting the average full-chain Root Mean Square Deviation by ~15%, and crucially, achieves the highest full-chain Amino Acid Recovery on the functionally dominant CDR-H3 loop (45.67%). By aligning generative dynamics with physical laws, FP-AbDiff enhances robustness and generalizability, establishing a principled approach for physically faithful and functionally viable antibody design.
academic
FP-AbDiff: Verbesserung des Score-basierten Antikörperdesigns durch Erfassung von Nichtgleichgewichtsdynamiken mittels der zugrunde liegenden Fokker-Planck-Gleichung
Das computergestützte Antikörperdesign birgt enormes Potenzial für die therapeutische Entdeckung, wird aber durch zwei grundlegende Herausforderungen bei bestehenden Generierungsmodellen eingeschränkt: (i) fehlende Dynamikkonsistenz, die zu physikalisch unplausiblen Strukturen führt; (ii) schlechte Generalisierungsfähigkeit aufgrund von Datenmangel und strukturellen Verzerrungen. Dieser Artikel stellt FP-AbDiff vor, den ersten Antikörpergenerator, der die physikalischen Gesetze der Fokker-Planck-Gleichung (FPE) über die gesamte Generierungsbahn durchsetzt. Die Methode minimiert eine neuartige FPE-Residuumsverlustfunktion auf der hybriden Mannigfaltigkeit (R³×SO(3)) der CDR-Geometrie und zwingt lokal gelernte Denoise-Scores dazu, sich zu einem global konsistenten Wahrscheinlichkeitsfluss zusammenzusetzen. Dieser physikalisch informierte Regularisierer wird synergistisch mit tiefgreifenden biologischen Priors innerhalb eines modernen SE(3)-äquivarianten Diffusionsrahmens integriert.
Das Antikörperdesign steht vor zwei kritischen Herausforderungen:
Fehlende Dynamikkonsistenz: Bestehende Diffusionsmodelle wie DiffAb, AbDiffuser und AbX optimieren Strukturen bei unabhängigen Rauschpegeln, ohne die sie verbindenden Pfade zu beschränken. Ihre Denoise-Score-Matching (DSM)-Ziele erfassen lokale Gradienten, ignorieren aber globale Übergänge und erzeugen häufig chemisch unplausible Schleifenumlagerungen, instabile Seitenketten-Packungen und energetisch angespannte Konformationen.
Unzureichende Generalisierungsfähigkeit: Diffusionsgeneratoren zeigen schlechte Leistung außerhalb des engen Bereichs aktueller Datensätze, was ihren praktischen Anwendungswert einschränkt. Der Hauptbenchmark SAbDab enthält weniger als 5000 nicht-redundante Komplexe und ist stark auf wenige humane IgG-Gerüste mit Virus-Epitop-Bindung ausgerichtet.
CDR-Spezifität und Affinität stammen aus subtilen, kontinuierlichen Konformationsänderungen, nicht aus isolierten Struktur-Snapshots. Bestehende Methoden ermangeln eines expliziten Mechanismus zur Durchsetzung zeitlicher Konsistenz und fallen bei außerverteilten (OOD) Aufgaben häufig in vertraute Muster zurück.
Erstmaliger FPE-Regularisierungsrahmen: FP-AbDiff führt den ersten Diffusionsrahmen für CDRs ein, der Score-Fokker-Planck-Konsistenz auf R³×SO(3) durchsetzt, globale Konsistenz des Wahrscheinlichkeitsflusses sichert und nicht-physikalische Schleifenübergänge eliminiert.
Vereinigung von Physik und biologischen Priors: Vereinigt Fokker-Planck-Physik mit evolutionären, geometrischen und energetischen Priors in einem einzigen Ziel, um dynamikkonsistente und verallgemeinerbare Antikörpergenerierung zu erreichen.
SOTA-Leistungsdurchbruch: Erreicht modernste Leistung bei Antikörperdesign- und Optimierungsaufgaben mit 0,99 Å RMSDFv beim CDR-H3-Design (25% Verbesserung gegenüber AbX) und 39,91% Kontakt-Aminosäure-Wiederherstellungsrate.
Das Antikörperdesign wird als bedingte CDR-Generierung unter Berücksichtigung des Strukturkontextes C (Antigen und Gerüst) formuliert. CDRs werden durch ihren echten Zustand S₀=(A₀,X₀,R₀) bei t=0 definiert, einschließlich:
Bei der anspruchsvolleren Designaufgabe für den gesamten Epitop-Bereich erreicht FP-AbDiff die niedrigsten RMSDFull-Werte über alle sechs CDRs, mit durchschnittlich etwa 15% reduziertem geometrischen Fehler im Vergleich zu AbX und der höchsten AARFull (45,67%) auf der funktional kritischen CDR-H3-Schleife.
Das vollständige Modell erreicht die höchste Treue; das Entfernen des R³-Terms verschlechtert die Gerüst- und Schnittstellenqualität; das Entfernen des SO(3)-Terms erhöht zwar IMP, verschlechtert aber RMSD und AAR.
Bei iterativer Denoise-Optimierung folgt AbX einer "hoher Gewinn, aber fragil"-Trajektorie, während FP-AbDiff ab t=8 konsistent niedrigere RMSD- und höhere DockQ-Werte beibehält, was einen stabileren Optimierungspfad widerspiegelt.
Frühe Methoden wie RosettaAntibodyDesign verlassen sich auf statistische Energiefunktionen und Monte-Carlo-Sampling, sind aber durch hohe Rechenkosten und begrenzte Sampling-Effizienz eingeschränkt.
FP-AbDiff ist der erste Rahmen, der physikalische Selbstkonsistenz in der Antikörpergenerierung durchsetzt und das Problem der Dynamikkonsistenz durch Fokker-Planck-Regularisierung löst.
FP-AbDiff übertrifft durch die Durchsetzung der Fokker-Planck-Physik konsistent die modernsten Baselines bei allen Bewertungsaufgaben des Antikörperdesigns und erreicht hochgetreue Strukturen, präzise Schnittstellen und stabile Generierungstrajektorien.
Theoretische Innovation: Erstmalige Einführung der Fokker-Planck-Gleichung in das Antikörperdesign, Lösung des Dynamikkonsistenz-Problems
Technologischer Fortschritt: Geschickte Kombination von Physik und tiefem Lernen, Umsetzung von Konsistenzbeschränkungen auf der hybriden Mannigfaltigkeit R³×SO(3)
Umfassende Experimente: Vollständige Baseline-Vergleiche, Ablationsstudien und Fallanalysen
Herausragende Leistung: SOTA bei mehreren Metriken erreicht, besonders die 25%ige RMSD-Verbesserung ist signifikant
Diese Arbeit bietet ein neues Forschungsparadigma für das interdisziplinäre Feld der Computationalbiologie und des maschinellen Lernens, kombiniert physikalische Gesetze mit tiefen Generierungsmodellen und hat wichtige Bedeutung für Proteindesign, Wirkstoffentdeckung und andere Bereiche.
Das Papier zitiert umfangreiche verwandte Arbeiten, einschließlich:
Grundlagentheorie von Diffusionsmodellen (Song & Ermon 2019; Ho et al. 2020)
Antikörperdesign-Methoden (Adolf-Bryfogle et al. 2018; Luo et al. 2022)
Geometrisches tiefes Lernen (Yim et al. 2023; Bortoli et al. 2022)
Anwendungen der Fokker-Planck-Gleichung (Lai et al. 2023)
Dieses Papier leistet einen wichtigen Beitrag zum Bereich des computergestützten Antikörperdesigns, verbessert die Leistung und Zuverlässigkeit von Generierungsmodellen durch die Einführung physikalischer Beschränkungen erheblich und bietet wertvolle neue Perspektiven für zukünftige Proteindesign-Forschung.