FP-AbDiff: Improving Score-based Antibody Design by Capturing Nonequilibrium Dynamics through the Underlying Fokker-Planck Equation
Chen, Xiong, Li et al.
Computational antibody design holds immense promise for therapeutic discovery, yet existing generative models are fundamentally limited by two core challenges: (i) a lack of dynamical consistency, which yields physically implausible structures, and (ii) poor generalization due to data scarcity and structural bias. We introduce FP-AbDiff, the first antibody generator to enforce Fokker-Planck Equation (FPE) physics along the entire generative trajectory. Our method minimizes a novel FPE residual loss over the mixed manifold of CDR geometries (R^3 x SO(3)), compelling locally-learned denoising scores to assemble into a globally coherent probability flow. This physics-informed regularizer is synergistically integrated with deep biological priors within a state-of-the-art SE(3)-equivariant diffusion framework. Rigorous evaluation on the RAbD benchmark confirms that FP-AbDiff establishes a new state-of-the-art. In de novo CDR-H3 design, it achieves a mean Root Mean Square Deviation of 0.99 Ã when superposing on the variable region, a 25% improvement over the previous state-of-the-art model, AbX, and the highest reported Contact Amino Acid Recovery of 39.91%. This superiority is underscored in the more challenging six-CDR co-design task, where our model delivers consistently superior geometric precision, cutting the average full-chain Root Mean Square Deviation by ~15%, and crucially, achieves the highest full-chain Amino Acid Recovery on the functionally dominant CDR-H3 loop (45.67%). By aligning generative dynamics with physical laws, FP-AbDiff enhances robustness and generalizability, establishing a principled approach for physically faithful and functionally viable antibody design.
academic
FP-AbDiff: Улучшение дизайна антител на основе оценок путём захвата неравновесной динамики через лежащее в основе уравнение Фоккера-Планка
Вычислительный дизайн антител имеет огромный потенциал для терапевтического открытия, однако существующие генеративные модели ограничены двумя основными проблемами: (i) отсутствие динамической согласованности, приводящее к физически нереальным структурам; (ii) плохая обобщаемость из-за нехватки данных и смещения структуры. В этой работе представлен FP-AbDiff — первый генератор антител, который применяет физические законы уравнения Фоккера-Планка (УФП) на всей траектории генерации. Метод минимизирует новую функцию потерь остатка УФП на гибридном многообразии геометрии CDR (R³×SO(3)), принуждая локально обученные оценки шумоподавления собираться в глобально согласованный вероятностный поток. Этот физико-информированный регуляризатор синергетически интегрирован с глубокими биологическими приорами в рамках передовой SE(3)-эквивариантной диффузионной архитектуры.
Дизайн антител сталкивается с двумя ключевыми проблемами:
Отсутствие динамической согласованности: Существующие модели диффузии, такие как DiffAb, AbDiffuser и AbX, оптимизируют структуры при независимых уровнях шума, никогда не ограничивая пути, их соединяющие. Их целевые функции сопоставления оценок шумоподавления (DSM) захватывают локальные градиенты, но игнорируют глобальные преобразования, часто производя химически нереальные переупорядочения петель, нестабильные укладки боковых цепей и энергетически напряжённые конформации.
Недостаточная обобщаемость: Генеративные модели диффузии плохо работают за пределами узкого диапазона текущих наборов данных, что ограничивает их практическую ценность. Основной эталон SAbDab содержит менее 5000 неизбыточных комплексов и сильно смещён в сторону небольшого числа человеческих каркасов IgG, связанных с вирусными эпитопами.
Специфичность CDR и сродство возникают из тонких, непрерывных конформационных движений, а не из изолированных снимков структуры. Существующие методы не имеют явного механизма для обеспечения временной согласованности и часто возвращаются к знакомым паттернам при столкновении с задачами вне распределения (OOD).
Первая структура регуляризации УФП: FP-AbDiff вводит первую диффузионную структуру для CDR, которая применяет согласованность оценок-Фоккера-Планка на R³×SO(3), обеспечивая глобально согласованный вероятностный поток и устраняя нефизические переходы петель.
Объединение физических законов и биологических приоров: Объединяет физику Фоккера-Планка с эволюционными, геометрическими и энергетическими приорами в единую целевую функцию, обеспечивая динамически согласованное и обобщаемое создание антител.
Прорыв в производительности SOTA: Достигает передовой производительности в задачах дизайна и оптимизации антител, достигая 0,99 Å RMSDFv при дизайне CDR-H3 (улучшение на 25% по сравнению с AbX) и 39,91% восстановления контактных аминокислот.
Дизайн антител формулируется как условная генерация CDR при заданном структурном контексте C (антиген и каркас). CDR определяется его истинным состоянием в момент t=0: S₀=(A₀,X₀,R₀), включая:
В более сложной задаче дизайна полного сайта связывания FP-AbDiff достигает наименьшей RMSDFull на всех шести CDR, с примерно 15% снижением средней геометрической ошибки по сравнению с AbX, достигая наивысшей AARFull (45,67%) на функционально критичной петле CDR-H3.
Полная модель достигает наивысшей верности, удаление члена R³ снижает качество остова и интерфейса, удаление члена SO(3) увеличивает IMP, но ухудшает RMSD и AAR.
При итеративной оптимизации шумоподавления AbX следует траектории "высокий прирост, но хрупкий", в то время как FP-AbDiff поддерживает последовательно более низкий RMSD и более высокий DockQ начиная с t=8, отражая более стабильный путь оптимизации.
Ранние методы, такие как RosettaAntibodyDesign, полагаются на статистические энергетические функции и выборку методом Монте-Карло, но ограничены высокими вычислительными затратами и ограниченной эффективностью выборки.
Модели, ориентированные на последовательность: Модели языков белков рассматривают белки как текстовые входные данные, но игнорируют пространственные и геометрические приоры
Геометрически эквивариантные модели: Модели GNN MEAN, dyMEAN и предсказатели, такие как AlphaFold2
Модели диффузии: DiffAb, AbDiffuser и другие, но без временной согласованности
FP-AbDiff — первая структура, которая применяет физическую самосогласованность при создании антител, решая проблему динамической согласованности через регуляризацию Фоккера-Планка.
FP-AbDiff последовательно превосходит передовые базовые показатели во всех задачах оценки дизайна антител путём применения физических законов Фоккера-Планка, достигая высокой верности структуры, точного интерфейса и стабильных траекторий генерации.
Эта работа предоставляет новую исследовательскую парадигму для пересечения вычислительной биологии и машинного обучения, объединяя физические законы с глубокими генеративными моделями, имеющими важное значение для дизайна белков, открытия лекарств и других областей.
Статья цитирует обширный спектр связанных работ, включая:
Теорию основ моделей диффузии (Song & Ermon 2019; Ho et al. 2020)
Методы дизайна антител (Adolf-Bryfogle et al. 2018; Luo et al. 2022)
Геометрическое глубокое обучение (Yim et al. 2023; Bortoli et al. 2022)
Применение уравнения Фоккера-Планка (Lai et al. 2023)
Эта статья вносит важный вклад в область вычислительного дизайна антител, значительно повышая производительность и надёжность генеративных моделей путём введения физических ограничений, предоставляя ценные новые идеи для будущих исследований в области дизайна белков.