CADE 2.5 - ZeResFDG: Frequency-Decoupled, Rescaled and Zero-Projected Guidance for SD/SDXL Latent Diffusion Models
Rychkovskiy, GPT-5
We introduce CADE 2.5 (Comfy Adaptive Detail Enhancer), a sampler-level guidance stack for SD/SDXL latent diffusion models. The central module, ZeResFDG, unifies (i) frequency-decoupled guidance that reweights low- and high-frequency components of the guidance signal, (ii) energy rescaling that matches the per-sample magnitude of the guided prediction to the positive branch, and (iii) zero-projection that removes the component parallel to the unconditional direction. A lightweight spectral EMA with hysteresis switches between a conservative and a detail-seeking mode as structure crystallizes during sampling. Across SD/SDXL samplers, ZeResFDG improves sharpness, prompt adherence, and artifact control at moderate guidance scales without any retraining. In addition, we employ a training-free inference-time stabilizer, QSilk Micrograin Stabilizer (quantile clamp + depth/edge-gated micro-detail injection), which improves robustness and yields natural high-frequency micro-texture at high resolutions with negligible overhead. For completeness we note that the same rule is compatible with alternative parameterizations (e.g., velocity), which we briefly discuss in the Appendix; however, this paper focuses on SD/SDXL latent diffusion models.
academic
CADE 2.5 - ZeResFDG: SD/SDXL 잠재 확산 모델을 위한 주파수 분리, 재조정 및 영점 투영 지도
본 논문은 SD/SDXL 잠재 확산 모델을 위한 샘플러 수준의 지도 스택인 CADE 2.5 (Comfy Adaptive Detail Enhancer)를 제안합니다. 핵심 모듈인 ZeResFDG는 세 가지 주요 기술을 통합합니다: (1) 주파수 분리 지도 - 지도 신호의 저주파 및 고주파 성분을 재가중화; (2) 에너지 재조정 - 지도된 예측의 샘플별 진폭을 양의 분기와 일치시킴; (3) 영점 투영 - 무조건 방향과 평행한 성분 제거. 경량 주파수 지수이동평균(EMA)과 지연 메커니즘은 샘플링 과정 중 구조 결정화 시 보수 모드와 세부 추구 모드 사이를 전환합니다. 본 방법은 중간 규모의 지도에서 명확도, 프롬프트 준수 및 아티팩트 제어를 개선하며, 재훈련이 필요하지 않습니다.
잠재 확산 모델(SD/SDXL 등)은 고충실도 이미지를 생성할 수 있지만, 큰 분류기 자유 지도(CFG) 규모에서 품질 저하가 발생하며, 이는 과포화, 색조 편이 또는 텍스처 아티팩트로 나타납니다. CFG를 낮추어 이러한 효과를 피하면 종종 명확도와 프롬프트 준수가 희생됩니다.
종합 평가: 이것은 기술성이 매우 높은 공학 최적화 논문으로, 이론적 깊이와 평가 포괄성 측면에서 부족한 점이 있지만, 실용적 가치가 매우 높으며 확산 모델의 실제 응용을 위한 효과적인 개선 방안을 제공합니다. 방법의 훈련 자유 특성과 현저한 시각적 개선 효과는 좋은 응용 전망을 가집니다.