2025-11-19T18:58:14.309516

A Connection Between Score Matching and Local Intrinsic Dimension

Yeats, Jacobson, Hannan et al.

The local intrinsic dimension (LID) of data is a fundamental quantity in signal processing and learning theory, but quantifying the LID of high-dimensional, complex data has been a historically challenging task. Recent works have discovered that diffusion models capture the LID of data through the spectra of their score estimates and through the rate of change of their density estimates under various noise perturbations. While these methods can accurately quantify LID, they require either many forward passes of the diffusion model or use of gradient computation, limiting their applicability in compute- and memory-constrained scenarios. We show that the LID is a lower bound on the denoising score matching loss, motivating use of the denoising score matching loss as a LID estimator. Moreover, we show that the equivalent implicit score matching loss also approximates LID via the normal dimension and is closely related to a recent LID estimator, FLIPD. Our experiments on a manifold benchmark and with Stable Diffusion 3.5 indicate that the denoising score matching loss is a highly competitive and scalable LID estimator, achieving superior accuracy and memory footprint under increasing problem size and quantization level.

academic

スコアマッチングと局所内在次元の関連性

基本情報

論文ID: 2510.12975
タイトル: A Connection Between Score Matching and Local Intrinsic Dimension
著者: Eric Yeats, Aaron Jacobson, Darryl Hannan, Yiran Jia, Timothy Doster, Henry Kvinge, Scott Mahan (PNNL, UNC Chapel Hill, UC San Diego)
分類: cs.LG stat.ML
発表時期/会議: NeurIPS 2025の第3回SPIGM Workshop採択
論文リンク: https://arxiv.org/abs/2510.12975

要約

局所内在次元（Local Intrinsic Dimension, LID）は信号処理および学習理論における基本的な量であるが、高次元複雑データのLIDを定量化することは従来から困難な課題である。最近の研究により、拡散モデルがスコア推定のスペクトルおよび様々なノイズ摂動下での密度推定の変化率を通じてデータのLIDを捉えることが明らかになった。これらの方法はLIDを正確に定量化できるものの、拡散モデルの複数回の順伝播またはグラディエント計算が必要であり、計算およびメモリが制限されるシナリオでの適用性が限定される。

本論文は、LIDが除ノイズスコアマッチング損失の下界であることを証明し、除ノイズスコアマッチング損失をLID推定器として使用するための理論的根拠を提供する。さらに、著者らは等価な陰的スコアマッチング損失も法線次元を通じてLIDを近似し、最近のLID推定器FLIPDと密接に関連していることを証明する。多様体ベンチマークおよびStable Diffusion 3.5での実験により、除ノイズスコアマッチング損失が高度に競争力のあるLID推定器であり、問題規模および定量化水準の増加に伴い優れた精度とメモリ占有率を実現することが示される。

研究背景と動機

問題定義

高次元データは通常低次元構造を有しており、これは多様体仮説と呼ばれ、機械学習の中核的仮説である。局所内在次元（LID）はデータの低次元構造を包含する基本的な量であり、点xに対して、LIDはx周辺で無損失にデータを符号化するために必要な局所次元である。

重要性

信号処理上の意義：LIDは分布（局所的）圧縮性の限界を決定する
深層学習における価値：より低いLIDは学習の統計的効率を向上させ、学習と汎化を容易にする
実用的応用：異常検出、クラスタリング、セグメンテーションなどの工学的タスクで広く応用される

既存手法の限界

非パラメトリック手法：大量のサンプルデータが必要であり、ハイパーパラメータ選択に強く影響され、低データ設定での汎化が困難
パラメトリック手法：深層生成モデルの利用により拡張性を有するが、LIDLは複数の生成モデルを必要とし、FLIPDおよび法線束方法はグラディエント計算または大量の順伝播を必要とする

研究動機

既存のパラメトリックLID推定方法は計算およびメモリ効率の面で制限があり、特に大規模応用においてそうである。本論文は、より効率的でスケーラブルなLID推定方法の発見を目指している。

核心的貢献

理論的貢献：除ノイズスコアマッチング損失がLIDを下界として有することを証明し、スケーラブルなLID推定器としての使用に対する理論的基礎を提供
方法の関連性：スコアマッチング損失と現在の主要推定器（FLIPDおよび法線束方法）間の密接な関係を確立
実験的検証：多様体ベンチマークおよびStable Diffusion 3.5/2.0での実験により、除ノイズスコアマッチング損失が高度に競争力のあるLID推定器であることを実証
実用的利点：メモリ占有率および定量化一貫性の面で優れたスケーラビリティを示す

方法の詳細

タスク定義

d次元データ多様体M⊂Rⁿからサンプリングされた点xが与えられたとき、その局所内在次元dを推定する。入力は高次元データ点であり、出力は対応するLID推定値である。

核心理論

定理3.1：除ノイズスコアマッチング損失下界

d次元多様体Mからサンプリングされた確率変数xに対して、σ→0⁺が十分に小さい場合：

E_x[L_DSM(x,σ,θ)] ≥ d

ここで除ノイズスコアマッチング損失は以下のように定義される：

E_x[L_DSM(x,σ,θ)] := E_{x~p(x),ε~N(0,I)} σ²||ε/σ + s_θ(x+σε)||²

証明の概要：

ノイズεを接空間および法空間成分に分解
接空間成分：各次元の期待二乗誤差は約1
法空間成分：多様体構造により、期待二乗誤差は約0
合計によりLIDを下界として得る

定理3.3：陰的スコアマッチング損失下界

E_{x̃}[L_ISM(x̃,σ,θ)] ≥ -(n-d)

これは陰的スコアマッチング損失が負の法線次元を下界として有することを示す。

既存手法との関連性

FLIPDとの関係

点xでのFLIPDの計算は：

FLIPD(x,σ,θ) := L_ISM(x,σ,θ) + σ²/2||s_θ(x)||² + n

定理3.3により以下が証明できる：

E_{x̃}[FLIPD(x̃,σ,θ)] ≥ d

法線束方法との関係

法線束方法はm×n行列の特異値を計算するのに対し、本論文で提案される誤差束方法は誤差ベクトル行列の固有値を計算する。除ノイズ損失はグラム行列固有値のトレース（面積）に等しく、小サンプル時でも正確である。

実験設定

データセット

scikit-dimensionパッケージの既知LID多様体を使用：

d=16, n=64の超球面および超球
d=128, n=256のHyperTwinPeaks
d=32, n=128のClifford環面および非線形多様体

モデルアーキテクチャ

DiT (Diffusion Transformer)：パッチサイズ=4、隠れ次元=128、16注意ヘッド、8層
MLP：スキップ接続付き、FLIPDで使用されるアーキテクチャに類似

評価指標

主要指標：真のLIDと推定LID間の平均絶対誤差（MAE）
補助指標：ピークGPUメモリ使用量、定量化後の性能変化

比較手法

非パラメトリック手法：MLE、TwoNN、ESS
パラメトリック手法：FLIPD
ノイズ水準：σ = 0.01、0.02、0.05

実験結果

主要結果

多様体ベンチマーク実験

表1に示される主要な発見：

DiTアーキテクチャ下：
- 除ノイズ損失方法の平均MAE：2.21 (σ=0.05)
- FLIPDの平均MAE：23.05 (σ=0.05)
- 高次元高曲率多様体上で顕著な差異
MLPアーキテクチャ下：
- 除ノイズ損失方法の平均MAE：7.27 (σ=0.05)
- FLIPDの平均MAE：11.11 (σ=0.05)
- FLIPDはMLP上でより良好な性能
非パラメトリック手法：
- ESS最良性能：MAE 7.12 (k=100)
- 高次元多様体上で性能が大幅に低下