Latent Retrieval Augmented Generation of Cross-Domain Protein Binders
Zhang, Kong, Huang et al.
Designing protein binders targeting specific sites, which requires to generate realistic and functional interaction patterns, is a fundamental challenge in drug discovery. Current structure-based generative models are limited in generating nterfaces with sufficient rationality and interpretability. In this paper, we propose Retrieval-Augmented Diffusion for Aligned interface (RADiAnce), a new framework that leverages known interfaces to guide the design of novel binders. By unifying retrieval and generation in a shared contrastive latent space, our model efficiently identifies relevant interfaces for a given binding site and seamlessly integrates them through a conditional latent diffusion generator, enabling cross-domain interface transfer. Extensive exeriments show that RADiAnce significantly outperforms baseline models across multiple metrics, including binding affinity and recovery of geometries and interactions. Additional experimental results validate cross-domain generalization, demonstrating that retrieving interfaces from diverse domains, such as peptides, antibodies, and protein fragments, enhances the generation performance of binders for other domains. Our work establishes a new paradigm for protein binder design that successfully bridges retrieval-based knowledge and generative AI, opening new possibilities for drug discovery.
특정 위치의 단백질 결합자 설계는 약물 발견의 기본적인 과제로, 현실적이고 기능적인 상호작용 패턴의 생성이 필요합니다. 현재의 구조 기반 생성 모델은 충분한 합리성과 해석 가능성을 갖춘 인터페이스 생성에 제한이 있습니다. 본 논문은 알려진 인터페이스를 활용하여 새로운 결합자 설계를 지도하는 검색 증강 확산 정렬 인터페이스 프레임워크(RADiAnce)를 제안합니다. 공유 대조 잠재 공간에서 검색과 생성을 통합함으로써, 이 모델은 주어진 결합 위치에 대한 관련 인터페이스를 효율적으로 식별하고, 조건부 잠재 확산 생성기를 통해 원활하게 통합하여 교차 도메인 인터페이스 전이를 실현합니다.