Diffusion Posterior Sampling (DPS) provides a principled Bayesian approach to inverse problems by sampling from $p(x_0 \mid y)$. However, in practice, the goal of inverse problem solving is not to cover the posterior but to recover the most accurate reconstruction, where optimization-based diffusion solvers often excel despite lacking a clear probabilistic foundation. We introduce Local MAP Sampling (LMAPS), a new inference framework that iteratively solving local MAP subproblems along the diffusion trajectory. This perspective clarifies their connection to global MAP estimation and DPS, offering a unified probabilistic interpretation for optimization-based methods. Building on this foundation, we develop practical algorithms with a probabilistically interpretable covariance approximation, a reformulated objective for stability and interpretability, and a gradient approximation for non-differentiable operators. Across a broad set of image restoration and scientific tasks, LMAPS achieves state-of-the-art performance, including $\geq 2$ dB gains on motion deblurring, JPEG restoration, and quantization, and $>1.5$ dB improvements on inverse scattering benchmarks.
- ID статьи: 2510.07343
- Название: Local MAP Sampling for Diffusion Models
- Авторы: Shaorong Zhang (UC Riverside), Rob Brekelmans (Vector Institute), Greg Ver Steeg (UC Riverside)
- Классификация: cs.GR cs.AI eess.IV
- Время публикации/конференция: Препринт (На рецензии)
- Ссылка на статью: https://arxiv.org/abs/2510.07343
Диффузионная апостериорная выборка (DPS) предоставляет принципиальный байесовский подход к обратным задачам путём выборки из p(x0∣y). Однако на практике цель решения обратной задачи состоит не в покрытии апостериорного распределения, а в восстановлении наиболее точного результата реконструкции; методы диффузии на основе оптимизации обычно превосходят в этом отношении, несмотря на отсутствие чёткой вероятностной основы. В данной работе представлена локальная MAP-выборка (LMAPS) — новая схема вывода, которая итеративно решает локальные подзадачи MAP вдоль траектории диффузии. Этот подход проясняет связь с глобальной MAP-оценкой и DPS, обеспечивая единую вероятностную интерпретацию методов на основе оптимизации. На этой основе мы разработали практические алгоритмы с вероятностно интерпретируемыми аппроксимациями ковариации, переформулировкой целевой функции для стабильности и интерпретируемости, а также аппроксимацией градиентов для недифференцируемых операторов.
Модели диффузии сталкиваются с двумя основными вызовами при решении обратных задач:
- Несоответствие целей: DPS направлена на выборку из апостериорного распределения p(x0∣y), но практическая цель решения обратной задачи — получить наиболее точную реконструкцию, а не разнообразную выборку
- Отсутствие теоретической основы: Методы диффузии на основе оптимизации (такие как Resample, DiffPIR, DCDP) демонстрируют отличную производительность, но лишены чёткой вероятностной теоретической основы
- Практическая ориентация: Протоколы оценки обратных задач обычно сравниваются с единственным истинным эталоном и не предоставляют вознаграждения за полноту или разнообразие
- Теоретическое единство: Необходимо обеспечить вероятностную интерпретацию методов оптимизации и прояснить их связь с MAP-оценкой и DPS
- Повышение производительности: Достичь лучшей производительности реконструкции при сохранении теоретической основы
- Теоретический вклад: Предложена схема локальной MAP-выборки (LMAPS), которая итеративно решает локальные подзадачи MAP вдоль траектории диффузии, анализируется её связь с глобальной MAP и DPS, обеспечивается единая интерпретация TMPD и методов оптимизации для обратных задач
- Методологический вклад:
- Предоставлены вероятностно интерпретируемые аппроксимации ковариации, заменяющие эвристические выборы в существующих решателях
- Введена переформулировка целевой функции для достижения интерпретируемых параметров и улучшения стабильности
- Разработана стратегия аппроксимации градиентов для недифференцируемых операторов
- Экспериментальный вклад: Верификация на 10 задачах восстановления изображений и 3 научных обратных задачах; достижение лучших результатов в 46 из 60 случаев FFHQ/ImageNet; получение улучшения ≥2 дБ PSNR на задачах деблюринга движения, восстановления JPEG и квантования
Обратная задача направлена на восстановление неизвестного изображения или сигнала x0∈Rn из априорного распределения π(x0) и зашумленного измерения y∈Rm:
y=H(x0)+z
где H(⋅):Rn→Rm — прямой оператор, z∼N(0,σy2I) — шум измерения.
Глобальная MAP непосредственно оптимизирует полное апостериорное распределение:
x0MAP:=argmaxx0p(x0∣y)
Локальная MAP решает условную задачу оптимизации на каждом временном шаге t:
x0∗(t,xt,y):=argmaxp(x0∣xt,y)xt−Δt=g(x0∗,xt,ϵ),ϵ∼N(0,I)
- DPS: Использует условное математическое ожидание E[x0∣xt,y]
- DAPS: Выборка из p(x0∣xt,y)
- LMAPS: Использует условный режим argmaxp(x0∣xt,y)
Ключевое понимание: DPS и LMAPS эквивалентны только когда p(x0∣xt,y) является гауссовым распределением.
Применяется изотропная аппроксимация:
Σ0∣t≈SNRkI,SNR:=σt2αt2
Переформулировка исходной целевой функции:
x0∗=argmin{kSNR∥x0−m0∣t∥2+σy21∥y−H(x0)∥2}
в следующий вид:
x0∗=argmin{(1−μt)21∥x0−m0∣t∥2+μtk2∥y−H(x0)∥2}
где μt=σt2+k12σt2∈(0,1), обеспечивающая:
- Интерпретацию выпуклой комбинации: Веса (1−μt) и μt
- Автоматическое отжигание: По мере уменьшения σt2 переход от управления измерениями к управлению априором
- Численную стабильность: Избегание экстремального масштабирования SNR
Для недифференцируемых задач, таких как восстановление JPEG и квантование, используется суррогатный градиент:
∇x0∥y−H(x0)∥2≈2JH′(x0)T(H(x0)−y)
Для квантования применяется H′(x0)=x0, упрощаясь до:
∇x0∥y−H(x0)∥2≈2(H(x0)−y)
- Восстановление изображений: FFHQ 256×256 и ImageNet 256×256, по 100 тестовых изображений каждый
- Научные обратные задачи: Использование набора данных InverseBench, включающего изображения флуоресцентной микроскопии (линейное обратное рассеяние), данные GRMHD (визуализация чёрных дыр), данные fastMRI коленного сустава (сжатое зондирование MRI)
- Восстановление изображений: PSNR, SSIM, LPIPS
- Научные обратные задачи: Главным образом PSNR, дополненный специфичными для задачи метриками
Включают DDNM, DDRM, ΠGDM, DPS, LGD, PnP-DM, FPS, MCG-diff, RedDiff, DAPS, DiffPIR, DCDP, DMPlug и 12 других методов
- Количество шагов диффузии: обычно 200
- Количество шагов обновления градиента: 20-200 (в зависимости от задачи)
- Скорость обучения: 0.01-1.0 (зависит от задачи)
- Параметры k1: 0-10, k2: 0.01-30000
В таблице 1 LMAPS достигает лучшей производительности в 49 из 60 результатов:
- Деблюринг движения: 32.62 дБ на FFHQ против 29.66 дБ DAPS (+2.96 дБ)
- Восстановление JPEG: 27.25 дБ на FFHQ против 25.04 дБ ΠGDM (+2.21 дБ)
- Квантование: 29.51 дБ на FFHQ против 25.82 дБ ΠGDM (+3.69 дБ)
В таблице 2 LMAPS достигает лучшего PSNR на всех задачах:
- Линейное обратное рассеяние (NR=360): 38.07 дБ против 36.56 дБ RED-diff (+1.51 дБ)
- Линейное обратное рассеяние (NR=180): 37.19 дБ против 35.41 дБ RED-diff (+1.78 дБ)
- Линейное обратное рассеяние (NR=60): 30.75 дБ против 27.07 дБ RED-diff (+3.68 дБ)
Рисунок 4 показывает компромисс между количеством шагов оптимизации и шагов диффузии:
- Оптимальная производительность обычно наблюдается при NFE=200-500
- Увеличение количества шагов оптимизации на каждом шаге диффузии значительно улучшает производительность
- По сравнению с SITCOM (600 NFE), LMAPS достигает аналогичной производительности с меньшими вычислительными ресурсами
Таблица 3 показывает время выборки LMAPS на задаче деблюринга:
- LMAPS (200 шагов диффузии, 100 шагов оптимизации): 61 сек/изображение, 30.88 дБ
- DAPS (200 шагов диффузии, 100 шагов оптимизации): 110 сек/изображение, 29.19 дБ
- SITCOM (600 шагов): 73 сек/изображение, 29.93 дБ
DPS и её варианты решают обратные задачи путём прямой выборки из апостериорного распределения p(x0∣y), включая методы TMPD, DDNM, ΠGDM и другие.
Методы Resample, DiffPIR, DCDP, DMPlug и другие решают обратные задачи посредством чередования денойзирования, оптимизации и переиспользования выборок, демонстрируя отличную производительность, но лишены теоретической основы.
Недавние работы начали уделять внимание MAP-оценке при диффузионных априорах, но в основном ограничиваются линейными обратными задачами.
- Теоретическое единство: LMAPS обеспечивает единую вероятностную интерпретацию методов диффузии на основе оптимизации
- Повышение производительности: Достигнуто значительное улучшение PSNR на множестве задач, особенно на сложных нелинейных и недифференцируемых задачах
- Вычислительная эффективность: Демонстрирует лучшую вычислительную эффективность по сравнению с существующими методами
- Сходимость: Последовательность локальных MAP не обязательно сходится к глобальной MAP
- Разнообразие: По сравнению с DPS, LMAPS может производить меньше разнообразия выходных данных
- Чувствительность гиперпараметров: Требуется настройка параметров k1 и k2 для различных задач
Статья указывает на то, что ключевая роль глобальной MAP в байесовском выводе была значительно недооценена, и эффективное решение глобальной MAP при диффузионных априорах остаётся открытой проблемой. Хотя MAP может уменьшить разнообразие выходных данных путём концентрации на единственном режиме, он обеспечивает более высокую детерминированность и лучшее согласование с наблюдаемыми данными.
- Значительный теоретический вклад: Впервые обеспечена чёткая вероятностная интерпретация методов диффузии на основе оптимизации
- Комплексные эксперименты: Охватывают 10 задач восстановления изображений и 3 научные обратные задачи с полной экспериментальной установкой
- Явное улучшение производительности: Достигнуто значительное улучшение на 2 дБ и более на множестве сложных задач
- Практичный метод: Предоставлены эффективные стратегии обработки недифференцируемых операторов
- Ясное изложение: Теоретический анализ и описание методов хорошо структурированы
- Глубина теоретического анализа: Хотя обеспечена вероятностная интерпретация, анализ сходимости и теоретических гарантий относительно ограничен
- Сложность гиперпараметров: Требуется настройка нескольких гиперпараметров для каждой задачи, что может повлиять на обобщаемость метода
- Вычислительные издержки: Хотя более эффективен, чем некоторые методы, всё ещё требует множественных обновлений градиентов на каждом временном шаге
- Ограничения оценки: Основное внимание уделяется качеству реконструкции; оценка количественной оценки неопределённости недостаточна
- Академическая ценность: Предоставляет новую теоретическую перспективу для применения моделей диффузии в обратных задачах
- Практическая ценность: Имеет прямое применение в области восстановления изображений и научных вычислений
- Вдохновляющий потенциал: Может вдохновить дальнейшие исследования MAP-оценки для моделей диффузии
- Обратные задачи, требующие высокого качества реконструкции, а не разнообразия
- Задачи с недифференцируемыми прямыми операторами (такие как восстановление JPEG, квантование)
- Решение обратных задач в научных вычислениях
- Приложения реального времени с определёнными требованиями к вычислительной эффективности
Статья ссылается на важные работы в области моделей диффузии, решения обратных задач и байесовского вывода, включая исходные статьи ключевых методов DPS, DAPS, TMPD и других, обеспечивая хорошую литературную основу для связанных исследований.