2025-11-25T18:34:18.645261

Simultaneous Frequentist Calibration of Confidence Regions for Multiple Functionals in Constrained Inverse Problems

Batlle, Patil, Stanley et al.
Many scientific analyses require simultaneous comparison of multiple functionals of an unknown signal at once, calling for multidimensional confidence regions with guaranteed simultaneous frequentist under structural constraints (e.g., non-negativity, shape, or physics-based). This paper unifies and extends many previous optimization-based approaches to constrained confidence region construction in linear inverse problems through the lens of statistical test inversion. We begin by reviewing the historical development of optimization-based confidence intervals for the single-functional setting, from "strict bounds" to the Burrus conjecture and its recent refutation via the aforementioned test inversion framework. We then extend this framework to the multiple-functional setting. This framework can be used to: (i) improve the calibration constants of previous methods, yielding smaller confidence regions that still preserve frequentist coverage, (ii) obtain tractable multidimensional confidence regions that need not be hyper-rectangles to better capture functional dependence structure, and (iii) generalize beyond Gaussian error distributions to generic log-concave error distributions. We provide theory establishing nominal simultaneous coverage of our methods and show quantitative volume improvements relative to prior approaches using numerical experiments.
academic

Одновременная частотистская калибровка доверительных областей для множественных функционалов в ограниченных обратных задачах

Основная информация

  • ID статьи: 2510.11708
  • Название: Simultaneous Frequentist Calibration of Confidence Regions for Multiple Functionals in Constrained Inverse Problems
  • Авторы: Pau Batlle, Pratik Patil, Michael Stanley, Javier Ruiz Lupon, Houman Owhadi, Mikael Kuusela
  • Классификация: math.ST stat.TH
  • Дата публикации: 13 октября 2025 г.
  • Ссылка на статью: https://arxiv.org/abs/2510.11708

Аннотация

Многие научные анализы требуют одновременного сравнения нескольких функционалов неизвестного сигнала, что предполагает конструирование многомерных доверительных областей с гарантированным одновременным частотистским покрытием при структурных ограничениях (таких как неотрицательность, форма или физические ограничения). В данной работе авторы унифицируют и расширяют методы конструирования доверительных областей на основе оптимизации в ограниченных линейных обратных задачах с позиции статистического тестирования инверсии. Статья сначала рассматривает историческое развитие доверительных интервалов на основе оптимизации в однофункциональном случае, от "строгих границ" до гипотезы Бурруса и её недавнего опровержения через рамки тестирования инверсии. Затем авторы расширяют этот подход на многофункциональный случай. Предложенный метод позволяет: (i) улучшить константы калибровки предыдущих методов, получая меньшие доверительные области при сохранении частотистского покрытия; (ii) получить трактуемые многомерные доверительные области, которые не обязательно являются гиперпрямоугольниками, лучше отражая структуру зависимостей функционалов; (iii) обобщить результаты с гауссовых распределений ошибок на общие логарифмически вогнутые распределения ошибок.

Исследовательский контекст и мотивация

Постановка задачи

Статья рассматривает задачу конструирования одновременных доверительных областей для нескольких функционалов в линейных обратных задачах. Рассматривается линейная обратная задача: y=Kx+εy = Kx^* + \varepsilon где yRny \in \mathbb{R}^n — наблюдаемые данные, xRpx^* \in \mathbb{R}^p — неизвестные параметры, KRn×pK \in \mathbb{R}^{n \times p} — известный прямой оператор, εRn\varepsilon \in \mathbb{R}^n — случайный шум.

Мотивация исследования

  1. Научные требования: Многие научные анализы требуют одновременного вывода о нескольких линейных функционалах HxHx^* неизвестного сигнала, а не оценивания всего высокомерного параметра xx^*
  2. Информация об ограничениях: Истинный параметр xx^* обычно удовлетворяет ограничениям, основанным на априорном физическом знании (например, неотрицательность x0x^* \geq 0)
  3. Одновременное покрытие: Необходимо гарантировать одновременное частотистское покрытие для всех функционалов, а не только маргинальное покрытие

Ограничения существующих методов

  1. Консервативность: Традиционные методы одновременных строгих границ (SSB) чрезмерно консервативны, сначала конструируя доверительное множество для xx^*, а затем отображая его в пространство функционалов
  2. Ограничение гиперпрямоугольниками: Существующие методы обычно производят гиперпрямоугольные доверительные области, неспособные отразить структуру зависимостей между функционалами
  3. Проблемы калибровки: Исторические методы, такие как гипотеза Бурруса, лишены строгих теоретических гарантий

Основные вклады

  1. Унифицированный подход: Унификация методов конструирования однофункциональных и многофункциональных ограниченных доверительных областей через перспективу тестирования инверсии
  2. Теоретические прорывы:
    • Доказательство выпуклости функций квантилей для тестовых статистик λu2\lambda_u^2 и λ1\lambda^1
    • Определение местоположения оптимального решения задачи оптимизации квантилей
    • Установление стохастического доминирования между тестовыми статистиками
  3. Практические алгоритмы:
    • Предоставление оптимальных констант калибровки для задач с неотрицательными ограничениями
    • Разработка метода редукции TFM для высокомерных задач
    • Предложение техники разделения строкового/нулевого пространства
  4. Улучшение производительности: Значительное уменьшение объёма доверительных областей по сравнению с классическими методами при сохранении номинального уровня покрытия

Детальное описание методов

Определение задачи

Для матрицы HRk×pH \in \mathbb{R}^{k \times p} целью является конструирование конечно-выборочного доверительного множества Rα(y)RkR_\alpha(y) \subseteq \mathbb{R}^k уровня 1α1-\alpha для неизвестного вектора HxRkHx^* \in \mathbb{R}^k такого, что: PyPx(HxRα(y))1αP_{y \sim P_x}(Hx \in R_\alpha(y)) \geq 1-\alpha для всех xXx \in \mathcal{X} (множество ограничений).

Рамки тестирования инверсии

Обзор однофункционального случая

Для каждого μR\mu \in \mathbb{R} рассматривается проверка гипотез: H0:xΦμXпротивH1:xXΦμH_0: x^* \in \Phi_\mu \cap \mathcal{X} \quad \text{против} \quad H_1: x^* \in \mathcal{X} \setminus \Phi_\mu где Φμ={xRp:hTx=μ}\Phi_\mu = \{x \in \mathbb{R}^p: h^T x = \mu\}.

Расширение на многофункциональный случай

Для μRk\mu \in \mathbb{R}^k определяется Φμ={xRp:Hx=μ}\Phi_\mu = \{x \in \mathbb{R}^p: Hx = \mu\}, проверка гипотез принимает вид: H0:xΦμXпротивH1:xXΦμH_0: x^* \in \Phi_\mu \cap \mathcal{X} \quad \text{против} \quad H_1: x^* \in \mathcal{X} \setminus \Phi_\mu

Три типа тестовых статистик

Статья анализирует три типа тестовых статистик:

  1. Ограниченная вторая статистика λc2(μ,y)\lambda_c^2(\mu, y): λc2(μ,y)=minHx=μ,AxbKxy22minAxbKxy22\lambda_c^2(\mu, y) = \min_{Hx=\mu, Ax \leq b} \|Kx - y\|_2^2 - \min_{Ax \leq b} \|Kx - y\|_2^2
  2. Неограниченная вторая статистика λu2(μ,y)\lambda_u^2(\mu, y): λu2(μ,y)=minHx=μ,AxbKxy22minxRpKxy22\lambda_u^2(\mu, y) = \min_{Hx=\mu, Ax \leq b} \|Kx - y\|_2^2 - \min_{x \in \mathbb{R}^p} \|Kx - y\|_2^2
  3. Первая статистика λ1(μ,y)\lambda^1(\mu, y): λ1(μ,y)=minHx=μ,AxbKxy22\lambda^1(\mu, y) = \min_{Hx=\mu, Ax \leq b} \|Kx - y\|_2^2

Задача калибровки

Для каждой тестовой статистики необходимо определить пороги для гарантирования покрытия 1α1-\alpha:

  • Послойные пороги: d(μ)=supHx=μ,AxbQx,1αd^*(\mu) = \sup_{Hx=\mu, Ax \leq b} Q_{x,1-\alpha}
  • Глобальные пороги: D=supAxbQx,1αD^* = \sup_{Ax \leq b} Q_{x,1-\alpha}

где Qx,1αQ_{x,1-\alpha} — квантиль уровня (1α)(1-\alpha) для Zx=λ(Hx,Kx+ε)Z_x = \lambda(Hx, Kx + \varepsilon).

Ключевые теоретические результаты

Теорема о выпуклости

Теорема 5.4: Для любого фиксированного 0<α<10 < \alpha < 1 функция квантилей Qu2(x)Q_u^2(x) является выпуклой функцией xx.

Теорема о максимизации

Теорема 5.6 (линейные ограничения): При линейных ограничениях AxbAx^* \leq b, supxPQu2(x)=maxi=1:mQu2(pi)\sup_{x \in P} Q_u^2(x) = \max_{i=1:m} Q_u^2(p_i) где {pi}i=1m\{p_i\}_{i=1}^m — множество экстремальных точек многогранника PP.

Теорема 5.7 (конические ограничения): При конических ограничениях xCx^* \in C, supxCQu2(x)=Qu2(0)\sup_{x \in C} Q_u^2(x) = Q_u^2(0)

Экспериментальная установка

Численные примеры

Рассматривается задача с неотрицательными ограничениями: y=Kx+ε,εN(0,I),x0y = Kx + \varepsilon, \quad \varepsilon \sim N(0, I), \quad x^* \geq 0 где: K=(211011),H=(110011)K = \begin{pmatrix} 2 & 1 & 1 \\ 0 & 1 & 1 \end{pmatrix}, \quad H = \begin{pmatrix} 1 & -1 & 0 \\ 0 & 1 & -1 \end{pmatrix}

Сравниваемые методы

  1. SSB_x: Граница гиперпрямоугольника одновременных строгих границ в xx-описании
  2. SSB_μ: Одновременные строгие границы в μ\mu-описании
  3. QuantileZero_x/μ: Улучшенная версия с оптимальными константами
  4. Bonferroni: Интервалы произведения с коррекцией Бонферрони
  5. Split-метод: Техника разделения строкового/нулевого пространства

Метрики оценки

  • Эмпирическое покрытие: Проверка через N=105N = 10^5 переиспользований
  • Площадь области: Вычисление площади доверительной области с использованием полярной интеграции

Результаты экспериментов

Основные результаты

Доверительные области для фиксированных наблюдений

Для y=(0,0)y = (0,0) и y=(20,10)y = (20,10) методы μ\mu-описания производят выпуклые множества, строго содержащиеся в границах гиперпрямоугольника xx-описания, значительно уменьшая площадь области.

Распределение покрытия и площади

  • x=(0,0,0)x^* = (0,0,0): Метод QuantileZero_μ достигает приблизительно точного покрытия 68%, с минимальной средней площадью
  • x=(5,5,5)x^* = (5,5,5): Все методы показывают покрытие, но методы μ\mu-описания остаются значительно преимущественными по площади

Количественные улучшения

  1. Улучшение констант калибровки: Для уровней доверия 68% и 95% оптимальные константы составляют 1.644 и 5.139 соответственно, что значительно лучше, чем 2.279 и 5.991 для распределения χ22\chi^2_2
  2. Уменьшение площади: μ\mu-описание по сравнению с границей гиперпрямоугольника xx-описания показывает среднее уменьшение площади примерно на 30-50%

Связанные работы

Историческое развитие

  1. Burrus (1964): Первое предложение оптимизационного метода для ограниченных доверительных интервалов
  2. Rust & O'Leary (1986): Разработка практических алгоритмов
  3. Stark (1992): Предложение метода строгих границ
  4. Tenorio и др. (2007): Развитие техники редукции TFM

Современные достижения

  • Batlle и др. (2023): Опровержение гипотезы Бурруса через рамки тестирования инверсии
  • Литература по ограниченному выводу: Связь с теорией распределения χ2\chi^2-bar
  • Конформные предсказания: Различия в целях и предположениях

Заключение и обсуждение

Основные выводы

  1. Теоретический вклад: Установление унифицированного подхода тестирования инверсии для многофункциональных ограниченных доверительных областей
  2. Вычислительные преимущества: Предоставление масштабируемых алгоритмов для высокомерных задач
  3. Улучшение производительности: Значительное уменьшение объёма доверительных областей по сравнению с классическими методами

Ограничения

  1. Статистика λc2\lambda_c^2: Функция квантилей лишена выпуклости, задача максимизации остаётся открытой
  2. Вычислительная сложность: Поиск экстремальных точек в высокомерном случае может быть затруднительным
  3. Послойные пороги: Вычисление полной функции d(μ)d^*(\mu) обычно представляет вызов

Направления будущих исследований

  1. Расширение на негауссовы распределения: Обобщение на общие логарифмически вогнутые распределения
  2. Калибровка λc2\lambda_c^2: Разработка алгоритмов калибровки для статистики ограниченной второй статистики
  3. Асимптотическая теория: Исследование свойств при больших выборках
  4. Области применения: Расширение на ограничения формы и другие статистические задачи

Глубокая оценка

Преимущества

  1. Теоретическая строгость: Предоставление полного математического каркаса с доказательствами выпуклости и результатами оптимальности
  2. Практическая ценность: Разработка масштабируемых алгоритмов для решения высокомерных практических задач
  3. Унифицированная перспектива: Объединение исторически разрозненных методов в рамки тестирования инверсии
  4. Значительные улучшения: Значительное уменьшение доверительных областей при сохранении теоретических гарантий

Недостатки

  1. Теоретические пробелы: Полная теория для статистики λc2\lambda_c^2 остаётся неразработанной
  2. Вычислительные ограничения: Вычислительная сложность в некоторых высокомерных случаях
  3. Объём экспериментов: Численные эксперименты относительно простые, отсутствуют сложные практические приложения

Влияние

  1. Академический вклад: Предоставление новой теоретической основы для количественной оценки неопределённости в ограниченных обратных задачах
  2. Практическое применение: Широкие перспективы применения в физических науках, инженерии и других областях, требующих ограниченного вывода
  3. Методологическое значение: Рамки тестирования инверсии могут вдохновить решение других статистических задач

Сценарии применения

  • Одновременный вывод о множественных функционалах в линейных обратных задачах
  • Оценивание параметров с физическими ограничениями
  • Научные вычисления, требующие строгих частотистских гарантий
  • Количественная оценка неопределённости в высокомерных ограниченных задачах оптимизации

Библиография

Статья цитирует 47 связанных работ, охватывающих важные исследования в области ограниченного вывода, обратных задач, теории оптимизации и статистики, обеспечивая прочную теоретическую основу для исследования.