A Connection Between Score Matching and Local Intrinsic Dimension
Yeats, Jacobson, Hannan et al.
The local intrinsic dimension (LID) of data is a fundamental quantity in signal processing and learning theory, but quantifying the LID of high-dimensional, complex data has been a historically challenging task. Recent works have discovered that diffusion models capture the LID of data through the spectra of their score estimates and through the rate of change of their density estimates under various noise perturbations. While these methods can accurately quantify LID, they require either many forward passes of the diffusion model or use of gradient computation, limiting their applicability in compute- and memory-constrained scenarios.
We show that the LID is a lower bound on the denoising score matching loss, motivating use of the denoising score matching loss as a LID estimator. Moreover, we show that the equivalent implicit score matching loss also approximates LID via the normal dimension and is closely related to a recent LID estimator, FLIPD. Our experiments on a manifold benchmark and with Stable Diffusion 3.5 indicate that the denoising score matching loss is a highly competitive and scalable LID estimator, achieving superior accuracy and memory footprint under increasing problem size and quantization level.
국소 내재 차원(Local Intrinsic Dimension, LID)은 신호 처리 및 학습 이론의 기본 개념이지만, 고차원 복잡 데이터의 LID를 정량화하는 것은 역사적으로 도전적인 과제였습니다. 최근 연구에 따르면 확산 모델은 스코어 추정의 스펙트럼과 다양한 노이즈 섭동 하에서의 밀도 추정 변화율을 통해 데이터의 LID를 포착합니다. 이러한 방법들이 LID를 정확하게 정량화할 수 있지만, 확산 모델의 다중 순전파 또는 그래디언트 계산이 필요하여 계산 및 메모리 제약 환경에서의 적용성이 제한됩니다.
본 논문은 LID가 디노이징 스코어 매칭 손실의 하한임을 증명하여, 디노이징 스코어 매칭 손실을 LID 추정기로 사용하기 위한 이론적 근거를 제공합니다. 또한 동등한 암시적 스코어 매칭 손실도 법선 차원을 통해 LID를 근사하며, 최근의 LID 추정기인 FLIPD와 밀접한 관련이 있음을 증명합니다. 다양체 벤치마크 및 Stable Diffusion 3.5에서의 실험은 디노이징 스코어 매칭 손실이 고도로 경쟁력 있는 LID 추정기임을 보여주며, 문제 규모 및 정량화 수준이 증가할 때 우수한 정확도와 메모리 사용량을 달성합니다.
전체 평가: 이는 이론과 실제를 모두 중시하는 우수한 논문으로, LID 추정에 새로운 이론적 관점과 실용적 방법을 제공합니다. 일부 기술적 세부사항에서 개선의 여지가 있지만, 확산 모델의 기하학적 성질을 이해하고 LID 추정 방법을 개선하는 데 있어 핵심 기여를 합니다.