Hierarchical Bayesian Flow Networks for Molecular Graph Generation
Xiong, Chen, Li et al.
Molecular graph generation is essentially a classification generation problem, aimed at predicting categories of atoms and bonds. Currently, prevailing paradigms such as continuous diffusion models are trained to predict continuous numerical values, treating the training process as a regression task. However, the final generation necessitates a rounding step to convert these predictions back into discrete classification categories, which is intrinsically a classification operation. Given that the rounding operation is not incorporated during training, there exists a significant discrepancy between the model's training objective and its inference procedure. As a consequence, an excessive emphasis on point-wise precision can lead to overfitting and inefficient learning. This occurs because considerable efforts are devoted to capturing intra-bin variations that are ultimately irrelevant to the discrete nature of the task at hand. Such a flaw results in diminished molecular diversity and constrains the model's generalization capabilities. To address this fundamental limitation, we propose GraphBFN, a novel hierarchical coarse-to-fine framework based on Bayesian Flow Networks that operates on the parameters of distributions. By innovatively introducing Cumulative Distribution Function, GraphBFN is capable of calculating the probability of selecting the correct category, thereby unifying the training objective with the sampling rounding operation. We demonstrate that our method achieves superior performance and faster generation, setting new state-of-the-art results on the QM9 and ZINC250k molecular graph generation benchmarks.
분자 그래프 생성은 본질적으로 원자와 화학 결합의 범주를 예측하는 분류 생성 문제입니다. 현재 주류인 연속 확산 모델은 훈련 과정을 회귀 작업으로 취급하여 연속 수치를 예측하지만, 최종 생성 시 반올림 연산을 통해 이산 분류 범주로 변환해야 합니다. 훈련 과정에 반올림 연산이 포함되지 않아 모델의 훈련 목표와 추론 과정 사이에 현저한 차이가 존재하므로, 과적합, 학습 효율 저하, 분자 다양성 감소 등의 문제가 발생합니다. 이러한 근본적인 한계를 해결하기 위해 저자들은 GraphBFN을 제안합니다. 이는 베이지안 흐름 네트워크 기반의 계층적 조잡-세밀 프레임워크로, 누적분포함수를 혁신적으로 도입하여 올바른 범주를 선택할 확률을 계산함으로써 훈련 목표와 샘플링 반올림 연산을 통합합니다.
종합 평가: 이는 분자 그래프 생성의 핵심 문제를 성공적으로 식별하고 해결한 고품질 연구 논문입니다. 혁신적인 CDF 메커니즘과 계층적 프레임워크를 통해 이론적 엄밀성을 유지하면서 동시에 실용 성능을 현저히 향상시켰습니다. 이론 분석 깊이와 실험 규모 측면에서 개선 여지가 있지만, 그 기여는 해당 분야의 발전을 추진하기에 충분합니다.