We introduce GO-Diff, a diffusion-based method for global structure optimization that learns to directly sample low-energy atomic configurations without requiring prior data or explicit relaxation. GO-Diff is trained from scratch using a Boltzmann-weighted score-matching loss, leveraging only the known energy function to guide generation toward thermodynamically favorable regions. The method operates in a two-stage loop of self-sampling and model refinement, progressively improving its ability to target low-energy structures. Compared to traditional optimization pipelines, GO-Diff achieves competitive results with significantly fewer energy evaluations. Moreover, by reusing pretrained models across related systems, GO-Diff supports amortized optimization - enabling faster convergence on new tasks without retraining from scratch.
- 논문 ID: 2510.13448
- 제목: GO-Diff: Data-free and amortized global structure optimization
- 저자: Nikolaj Rønne, Tejs Vegge, Arghya Bhowmik (덴마크 기술대학교)
- 분류: physics.comp-ph cond-mat.dis-nn cond-mat.mtrl-sci cs.CE
- 발표 시간: 2025년 10월 15일 (사전 인쇄본)
- 논문 링크: https://arxiv.org/abs/2510.13448
본 논문은 확산 모델 기반의 전역 구조 최적화 방법인 GO-Diff를 소개한다. 이 방법은 사전 데이터나 명시적 완화 없이 저에너지 원자 구성을 직접 샘플링할 수 있다. GO-Diff는 볼츠만 가중 점수 매칭 손실을 사용하여 처음부터 훈련되며, 알려진 에너지 함수만을 활용하여 생성 과정을 열역학적으로 유리한 영역으로 유도한다. 이 방법은 자체 샘플링과 모델 정제의 2단계 순환을 채택하여 저에너지 구조 발견 능력을 점진적으로 향상시킨다. 기존 최적화 절차와 비교하여, GO-Diff는 훨씬 적은 에너지 평가로 경쟁력 있는 결과를 달성한다. 더욱이, 관련 시스템 간에 사전 훈련된 모델을 재사용함으로써 GO-Diff는 분할 상환 최적화를 지원한다. 즉, 처음부터 재훈련할 필요 없이 새로운 작업에서 더 빠르게 수렴할 수 있다.
본 연구는 원자 시스템의 전역 구조 최적화 문제, 즉 퍼텐셜 에너지 표면(PES)에서 저에너지의 안정적인 원자 구성을 찾는 문제를 다룬다. 퍼텐셜 에너지 표면은 원자 위치를 해당 퍼텐셜 에너지에 매핑하는 고차원 비볼록 함수이며, 이 표면을 탐색하여 저에너지 구조를 식별하는 것은 계산 재료 과학, 화학 및 촉매 분야의 기본적인 과제이다.
전역 구조 최적화는 촉매 표면 발견부터 기능성 재료 설계에 이르는 응용의 기초이며, 다음을 위해 중요하다:
- 새로운 촉매 표면의 발견
- 기능성 재료의 설계
- 안정적인 원자 구성의 예측
- 재료 특성의 이해
전통적인 전역 최적화 방법은 다음과 같은 문제점을 가진다:
- 높은 계산 비용: 무작위 구조 탐색(RSS), 분지 점프, 유전 알고리즘, 모의 담금질 등의 방법은 국소 완화 및 기울기 기반 최적화기에 의존하며, 많은 에너지 및 힘 평가가 필요하다
- 국소 최적화에 국한: 국소 최솟값에 쉽게 빠지며, 복잡한 에너지 경관의 탐색을 제한한다
- 데이터 의존성: 기계학습 원자간 퍼텐셜은 관련 최솟값을 포착하기 위해 신중하게 선택된 훈련 데이터가 필요하며, 그렇지 않으면 자기강화 국소 최솟값에 빠질 수 있다
- 이전 가능성 부족: 기존 방법은 관련 시스템 간에 학습된 지식을 재사용하기 어렵다
확산 모델은 분자 및 재료 과학의 구조 생성에서 전망을 보여주었지만, 이를 전역 최적화 작업에 적용하는 것은 도전적이다. 왜냐하면 목표는 PES의 전역 최솟값에 해당하는 희귀한 저에너지 구성을 샘플링하는 것이지만, 이러한 구조의 데이터 분포는 일반적으로 미지수이거나 접근 불가능하기 때문이다.
- 데이터 무관 생성 최적화 방법 제안: 사전 데이터나 명시적 완화 없이 퍼텐셜 에너지 표면의 최솟값을 직접 샘플링
- 볼츠만 가중 손실 함수 개발: 어닐링 전략과 결합하여 저에너지 영역으로의 샘플링을 유도하면서 탐색성 유지
- 분할 상환 최적화 구현: 관련 시스템 간 사전 훈련된 모델 전이를 통한 지식 재사용
- 우수한 샘플 효율성 검증: 고전적 탐색 방법과 비교하여 높은 샘플 효율성
입력: 원자 시스템의 에너지 함수 E(x), 여기서 x는 원자 구성
출력: 저에너지의 안정적인 원자 구성
목표: 볼츠만 분포에서 샘플링:
πT(x)=ZTexp(−E(x)/T)
GO-Diff는 자체 샘플링 순환 작동을 채택한다:
- 모델이 역확산을 통해 원자 구조 생성
- 생성된 구조의 에너지 평가
- 결과 샘플을 사용하여 모델 정제
재생 버퍼 B={(x0(i),E(i))}를 유지하여 생성된 구성 및 해당 에너지 저장
핵심 혁신은 볼츠만 가중 점수 매칭 손실이다:
LθBoltzmann=Et∼U(0,1)[λ(t)Ex0∼q,xt∼pt∣0(xt∣x0)w(E)∥sθ(xt,t)−∇xtlogpt∣0(xt∣x0)∥22]
여기서 볼츠만 가중치는:
w(E)=∑E(i)∈Bexp(−E(i)/T)exp(−E/T)
이러한 설계는 중요도 샘플링을 통해 실제 볼츠만 분포에서 직접 샘플링할 필요를 피한다.
온도 T는 높은 초기값에서 낮은 최종값으로 어닐링되어 탐색과 개발의 균형을 맞춘다:
- 초기: 높은 온도는 광범위한 탐색을 장려
- 후기: 낮은 온도는 깊은 최솟값으로 수렴
일반적으로 에너지와 함께 사용 가능한 원자 힘 활용:
- 점수 네트워크의 공유 표현 백본에 힘 예측 헤드 부착
- 예측-보정 샘플링 방식에서 예측된 힘 사용:
Δx=α(1−t)ζFθ(x)
- 확산 시간 t→0일 때, 보정 항이 더 큰 유도 역할 수행
- 직접 볼츠만 가중: 힘 평가 및 몬테카를로 추정을 피하고, 직접 볼츠만 가중 점수 매칭 손실 사용
- 자기 감독 학습: 외부 데이터 없이 자체 생성에서 학습
- 모델 전이: 관련 시스템 간 사전 훈련된 모델 전이 능력 시연
- 물리 유도: 힘장 정보를 통합하여 수렴 가속화
MACE-MP0 범용 퍼텐셜을 사용한 두 가지 원자 최적화 작업:
- Pt 계단 표면 위의 Pt 애드원자 최적화: 3D 시스템, 표면 법선을 따라 투영하여 2D로 시각화 가능
- 6×6 Pt(111) 표면 위의 Pt 헵타머 발견: 더 복잡한 시스템, 벤치마킹 및 분할 상환 최적화 검증용
- 목표 구조 발견의 성공률
- 목표 구조 발견에 필요한 평균 에너지 평가 횟수
- 시간에 따른 최적 에너지
- 무작위 구조 탐색(RSS): AGOX 소프트웨어 패키지를 사용한 전통적 방법
- GO-Diff 변형: FFG 미사용, FFG 사용, 모델 전이 사용
범용 하이퍼파라미터:
- 확산 샘플링 단계: 500
- 노이즈 스케줄: 선형(VE-SDE)
- 점수 모델 아키텍처: PaiNN GNN(4개 블록), 6Å 컷오프
- 최종 온도: 0.02
- 학습률: 10^-4
- 최적화기: AdamW
특정 작업 파라미터:
- Pt 애드원자: 버퍼 크기 16, 반복당 32개 샘플, 10회 반복 지수 어닐링
- Pt 헵타머: 버퍼 크기 64, 반복당 128개 샘플, 20회 반복 지수 어닐링
- 샘플링이 점진적으로 저에너지 분지로 집중됨을 성공적으로 시연
- 볼츠만 가중 손실 및 어닐링 스케줄의 유효성 검증
| 방법 | 평가 횟수 | 성공률 | 평균 성공 반복 |
|---|
| RSS | 10,000 | 1/8 | 7,816 |
| GO-Diff | 2,560 | 5/8 | 1,667 |
| GO-Diff + FFG | 2,560 | 8/8 | 1,994 |
| GO-Diff + 전이 | 1,280 | 7/8 | 591 |
- 샘플 효율성: GO-Diff는 훨씬 적은 에너지 평가로 더 나은 성공률 달성
- 힘장 유도 효과: FFG는 성공률을 향상시키고(5/8에서 8/8로) 성능 개선
- 전이 학습 이점: 모델 전이는 필요한 평가 횟수를 2배 이상 감소(1,667에서 591로)
- 견고성: 확산 과정의 확률성으로 GO-Diff가 국소 최솟값에서 견고하게 탈출 가능
전이 학습의 가속화는 예상된 결과이다. 전이된 모델이 이미 결합 선호도(예: 계단 모서리 아래 중공 위치의 안정성)를 포착했기 때문에, 최적화 작업은 처음부터 결합을 학습하는 것이 아니라 원자간 기하학 조정으로 축소된다.
- 무작위 구조 탐색, 분지 점프, 유전 알고리즘, 모의 담금질
- 기계학습 원자간 퍼텐셜(사전 훈련 또는 온라인 학습)
- 분자 및 재료 과학의 구조 생성
- 블랙박스 최적화의 확산 모델(DDOM)
- 볼츠만 샘플러(iDEM, BNEM, 인접 샘플링)
- 몬테카를로 추정 및 힘 라벨 회피
- 더 간단하고 샘플 효율적인 훈련 순환
- 시스템 간 전이 학습 능력의 첫 시연
- GO-Diff는 효과적인 데이터 무관 전역 구조 최적화 프레임워크
- 볼츠만 가중 점수 매칭 손실은 저에너지 구성 생성을 효과적으로 유도
- 분할 상환 최적화는 모델 전이를 통해 효율성을 크게 향상
- 샘플 효율성 및 성공률 측면에서 전통적 방법 우수
- 하이퍼파라미터 민감성: 샘플 수량, 온도 곡선 및 훈련 단계는 주요 하이퍼파라미터이며 신중한 조정 필요
- 확장성 제한: 현재의 원자 확산 모델은 주로 <20개 원자 시스템에서 검증됨
- 시스템 규모: GO-Diff를 매우 큰 현실적 규모 시스템에 적용하기 위한 추가 연구 필요
- 다중 목표 또는 성분 설계 최적화로 확장
- 동적 온도 조정 및 적응형 샘플링
- 대규모 시스템에 대한 확장성 향상
- 대리 가속화 및 다중 목표 최적화
- 방법론 혁신성: 확산 모델을 데이터 무관 전역 구조 최적화에 성공적으로 적용한 첫 사례
- 기술 선진성: 볼츠만 가중 점수 매칭 손실 설계가 정교하며 기존 방법의 복잡성 회피
- 실용적 가치: 분할 상환 최적화는 실제 응용에서 현저한 이점 시연
- 충분한 실험: 다양한 복잡도의 시스템에서 포괄적 테스트 수행
- 이론적 기초: 중요도 샘플링 기반 이론 유도가 엄밀함
- 시스템 규모 제한: 상대적으로 작은 원자 시스템(≤20개 원자)에서만 검증
- 하이퍼파라미터 조정: 방법이 여러 하이퍼파라미터에 민감하여 범용성 제한 가능
- 제한된 벤치마킹: RSS와만 비교하며 다른 현대적 방법과의 비교 부족
- 불충분한 이론 분석: 수렴성 및 샘플 복잡도에 대한 이론적 보증 부재
- 학술 기여: 전역 최적화 분야에 새로운 생성 모델링 패러다임 도입
- 실용적 가치: 재료 발견 및 촉매 설계에서 잠재적 응용
- 재현성: 완전한 코드 및 구현 세부사항 제공
- 영감: 확산 모델의 최적화 문제 응용에 새로운 방향 개척
- 재료 발견: 새로운 촉매 및 기능성 재료의 구조 예측
- 표면 과학: 흡착 위치 및 표면 재구성 연구
- 소분자 최적화: 분자 구조 탐색 및 약물 설계
- 기존 관련 시스템: 특히 유사 시스템 간 다중 최적화가 필요한 경우에 적합
본 논문은 전역 최적화, 확산 모델, 기계학습 퍼텐셜 등 주요 분야의 중요 연구 38편을 인용하여 방법 개발의 견고한 이론적 기초를 제공한다.