2025-11-25T18:34:18.645261

Simultaneous Frequentist Calibration of Confidence Regions for Multiple Functionals in Constrained Inverse Problems

Batlle, Patil, Stanley et al.

Many scientific analyses require simultaneous comparison of multiple functionals of an unknown signal at once, calling for multidimensional confidence regions with guaranteed simultaneous frequentist under structural constraints (e.g., non-negativity, shape, or physics-based). This paper unifies and extends many previous optimization-based approaches to constrained confidence region construction in linear inverse problems through the lens of statistical test inversion. We begin by reviewing the historical development of optimization-based confidence intervals for the single-functional setting, from "strict bounds" to the Burrus conjecture and its recent refutation via the aforementioned test inversion framework. We then extend this framework to the multiple-functional setting. This framework can be used to: (i) improve the calibration constants of previous methods, yielding smaller confidence regions that still preserve frequentist coverage, (ii) obtain tractable multidimensional confidence regions that need not be hyper-rectangles to better capture functional dependence structure, and (iii) generalize beyond Gaussian error distributions to generic log-concave error distributions. We provide theory establishing nominal simultaneous coverage of our methods and show quantitative volume improvements relative to prior approaches using numerical experiments.

academic

Одновременная частотистская калибровка доверительных областей для множественных функционалов в ограниченных обратных задачах

Основная информация

ID статьи: 2510.11708
Название: Simultaneous Frequentist Calibration of Confidence Regions for Multiple Functionals in Constrained Inverse Problems
Авторы: Pau Batlle, Pratik Patil, Michael Stanley, Javier Ruiz Lupon, Houman Owhadi, Mikael Kuusela
Классификация: math.ST stat.TH
Дата публикации: 13 октября 2025 г.
Ссылка на статью: https://arxiv.org/abs/2510.11708

Аннотация

Многие научные анализы требуют одновременного сравнения нескольких функционалов неизвестного сигнала, что предполагает конструирование многомерных доверительных областей с гарантированным одновременным частотистским покрытием при структурных ограничениях (таких как неотрицательность, форма или физические ограничения). В данной работе авторы унифицируют и расширяют методы конструирования доверительных областей на основе оптимизации в ограниченных линейных обратных задачах с позиции статистического тестирования инверсии. Статья сначала рассматривает историческое развитие доверительных интервалов на основе оптимизации в однофункциональном случае, от "строгих границ" до гипотезы Бурруса и её недавнего опровержения через рамки тестирования инверсии. Затем авторы расширяют этот подход на многофункциональный случай. Предложенный метод позволяет: (i) улучшить константы калибровки предыдущих методов, получая меньшие доверительные области при сохранении частотистского покрытия; (ii) получить трактуемые многомерные доверительные области, которые не обязательно являются гиперпрямоугольниками, лучше отражая структуру зависимостей функционалов; (iii) обобщить результаты с гауссовых распределений ошибок на общие логарифмически вогнутые распределения ошибок.

Исследовательский контекст и мотивация

Постановка задачи

Статья рассматривает задачу конструирования одновременных доверительных областей для нескольких функционалов в линейных обратных задачах. Рассматривается линейная обратная задача: $y = Kx^* + \varepsilon$ где $y \in \mathbb{R}^n$ — наблюдаемые данные, $x^* \in \mathbb{R}^p$ — неизвестные параметры, $K \in \mathbb{R}^{n \times p}$ — известный прямой оператор, $\varepsilon \in \mathbb{R}^n$ — случайный шум.

Мотивация исследования

Научные требования: Многие научные анализы требуют одновременного вывода о нескольких линейных функционалах $Hx^*$ неизвестного сигнала, а не оценивания всего высокомерного параметра $x^*$
Информация об ограничениях: Истинный параметр $x^*$ обычно удовлетворяет ограничениям, основанным на априорном физическом знании (например, неотрицательность $x^* \geq 0$ )
Одновременное покрытие: Необходимо гарантировать одновременное частотистское покрытие для всех функционалов, а не только маргинальное покрытие

Ограничения существующих методов

Консервативность: Традиционные методы одновременных строгих границ (SSB) чрезмерно консервативны, сначала конструируя доверительное множество для $x^*$ , а затем отображая его в пространство функционалов
Ограничение гиперпрямоугольниками: Существующие методы обычно производят гиперпрямоугольные доверительные области, неспособные отразить структуру зависимостей между функционалами
Проблемы калибровки: Исторические методы, такие как гипотеза Бурруса, лишены строгих теоретических гарантий

Основные вклады

Унифицированный подход: Унификация методов конструирования однофункциональных и многофункциональных ограниченных доверительных областей через перспективу тестирования инверсии
Теоретические прорывы:
- Доказательство выпуклости функций квантилей для тестовых статистик $\lambda_u^2$ и $\lambda^1$
- Определение местоположения оптимального решения задачи оптимизации квантилей
- Установление стохастического доминирования между тестовыми статистиками
Практические алгоритмы:
- Предоставление оптимальных констант калибровки для задач с неотрицательными ограничениями
- Разработка метода редукции TFM для высокомерных задач
- Предложение техники разделения строкового/нулевого пространства
Улучшение производительности: Значительное уменьшение объёма доверительных областей по сравнению с классическими методами при сохранении номинального уровня покрытия

Детальное описание методов

Определение задачи

Для матрицы $H \in \mathbb{R}^{k \times p}$ целью является конструирование конечно-выборочного доверительного множества $R_\alpha(y) \subseteq \mathbb{R}^k$ уровня $1-\alpha$ для неизвестного вектора $Hx^* \in \mathbb{R}^k$ такого, что: $P_{y \sim P_x}(Hx \in R_\alpha(y)) \geq 1-\alpha$ для всех $x \in \mathcal{X}$ (множество ограничений).

Рамки тестирования инверсии

Обзор однофункционального случая

Для каждого $\mu \in \mathbb{R}$ рассматривается проверка гипотез: $H_0: x^* \in \Phi_\mu \cap \mathcal{X} \quad \text{против} \quad H_1: x^* \in \mathcal{X} \setminus \Phi_\mu$ где $\Phi_\mu = \{x \in \mathbb{R}^p: h^T x = \mu\}$ .

Расширение на многофункциональный случай

Для $\mu \in \mathbb{R}^k$ определяется $\Phi_\mu = \{x \in \mathbb{R}^p: Hx = \mu\}$ , проверка гипотез принимает вид: $H_0: x^* \in \Phi_\mu \cap \mathcal{X} \quad \text{против} \quad H_1: x^* \in \mathcal{X} \setminus \Phi_\mu$

Три типа тестовых статистик

Статья анализирует три типа тестовых статистик:

Ограниченная вторая статистика $\lambda_c^2(\mu, y)$ : $\lambda_c^2(\mu, y) = \min_{Hx=\mu, Ax \leq b} \|Kx - y\|_2^2 - \min_{Ax \leq b} \|Kx - y\|_2^2$
Неограниченная вторая статистика $\lambda_u^2(\mu, y)$ : $\lambda_u^2(\mu, y) = \min_{Hx=\mu, Ax \leq b} \|Kx - y\|_2^2 - \min_{x \in \mathbb{R}^p} \|Kx - y\|_2^2$
Первая статистика $\lambda^1(\mu, y)$ : $\lambda^1(\mu, y) = \min_{Hx=\mu, Ax \leq b} \|Kx - y\|_2^2$

Задача калибровки

Для каждой тестовой статистики необходимо определить пороги для гарантирования покрытия $1-\alpha$ :

Послойные пороги: $d^*(\mu) = \sup_{Hx=\mu, Ax \leq b} Q_{x,1-\alpha}$
Глобальные пороги: $D^* = \sup_{Ax \leq b} Q_{x,1-\alpha}$

где $Q_{x,1-\alpha}$ — квантиль уровня $(1-\alpha)$ для $Z_x = \lambda(Hx, Kx + \varepsilon)$ .

Ключевые теоретические результаты

Теорема о выпуклости

Теорема 5.4: Для любого фиксированного $0 < \alpha < 1$ функция квантилей $Q_u^2(x)$ является выпуклой функцией $x$ .

Теорема о максимизации

Теорема 5.6 (линейные ограничения): При линейных ограничениях $Ax^* \leq b$ , $\sup_{x \in P} Q_u^2(x) = \max_{i=1:m} Q_u^2(p_i)$ где $\{p_i\}_{i=1}^m$ — множество экстремальных точек многогранника $P$ .

Теорема 5.7 (конические ограничения): При конических ограничениях $x^* \in C$ , $\sup_{x \in C} Q_u^2(x) = Q_u^2(0)$

Экспериментальная установка

Численные примеры

Рассматривается задача с неотрицательными ограничениями: $y = Kx + \varepsilon, \quad \varepsilon \sim N(0, I), \quad x^* \geq 0$ где: $K = \begin{pmatrix} 2 & 1 & 1 \\ 0 & 1 & 1 \end{pmatrix}, \quad H = \begin{pmatrix} 1 & -1 & 0 \\ 0 & 1 & -1 \end{pmatrix}$

Сравниваемые методы

SSB_x: Граница гиперпрямоугольника одновременных строгих границ в $x$ -описании
SSB_μ: Одновременные строгие границы в $\mu$ -описании
QuantileZero_x/μ: Улучшенная версия с оптимальными константами
Bonferroni: Интервалы произведения с коррекцией Бонферрони
Split-метод: Техника разделения строкового/нулевого пространства

Метрики оценки

Эмпирическое покрытие: Проверка через $N = 10^5$ переиспользований
Площадь области: Вычисление площади доверительной области с использованием полярной интеграции

Результаты экспериментов

Основные результаты

Доверительные области для фиксированных наблюдений

Для $y = (0,0)$ и $y = (20,10)$ методы $\mu$ -описания производят выпуклые множества, строго содержащиеся в границах гиперпрямоугольника $x$ -описания, значительно уменьшая площадь области.

Распределение покрытия и площади

$x^* = (0,0,0)$ : Метод QuantileZero_μ достигает приблизительно точного покрытия 68%, с минимальной средней площадью
$x^* = (5,5,5)$ : Все методы показывают покрытие, но методы $\mu$ -описания остаются значительно преимущественными по площади

Количественные улучшения

Улучшение констант калибровки: Для уровней доверия 68% и 95% оптимальные константы составляют 1.644 и 5.139 соответственно, что значительно лучше, чем 2.279 и 5.991 для распределения $\chi^2_2$
Уменьшение площади: $\mu$ -описание по сравнению с границей гиперпрямоугольника $x$ -описания показывает среднее уменьшение площади примерно на 30-50%

Связанные работы

Историческое развитие

Burrus (1964): Первое предложение оптимизационного метода для ограниченных доверительных интервалов
Rust & O'Leary (1986): Разработка практических алгоритмов
Stark (1992): Предложение метода строгих границ
Tenorio и др. (2007): Развитие техники редукции TFM

Современные достижения

Batlle и др. (2023): Опровержение гипотезы Бурруса через рамки тестирования инверсии
Литература по ограниченному выводу: Связь с теорией распределения $\chi^2$ -bar
Конформные предсказания: Различия в целях и предположениях

Заключение и обсуждение

Основные выводы

Теоретический вклад: Установление унифицированного подхода тестирования инверсии для многофункциональных ограниченных доверительных областей
Вычислительные преимущества: Предоставление масштабируемых алгоритмов для высокомерных задач
Улучшение производительности: Значительное уменьшение объёма доверительных областей по сравнению с классическими методами

Ограничения

Статистика $\lambda_c^2$ : Функция квантилей лишена выпуклости, задача максимизации остаётся открытой
Вычислительная сложность: Поиск экстремальных точек в высокомерном случае может быть затруднительным
Послойные пороги: Вычисление полной функции $d^*(\mu)$ обычно представляет вызов

Направления будущих исследований

Расширение на негауссовы распределения: Обобщение на общие логарифмически вогнутые распределения
Калибровка $\lambda_c^2$ : Разработка алгоритмов калибровки для статистики ограниченной второй статистики
Асимптотическая теория: Исследование свойств при больших выборках
Области применения: Расширение на ограничения формы и другие статистические задачи

Глубокая оценка

Преимущества

Теоретическая строгость: Предоставление полного математического каркаса с доказательствами выпуклости и результатами оптимальности
Практическая ценность: Разработка масштабируемых алгоритмов для решения высокомерных практических задач
Унифицированная перспектива: Объединение исторически разрозненных методов в рамки тестирования инверсии
Значительные улучшения: Значительное уменьшение доверительных областей при сохранении теоретических гарантий

Недостатки

Теоретические пробелы: Полная теория для статистики $\lambda_c^2$ остаётся неразработанной
Вычислительные ограничения: Вычислительная сложность в некоторых высокомерных случаях
Объём экспериментов: Численные эксперименты относительно простые, отсутствуют сложные практические приложения

Влияние

Академический вклад: Предоставление новой теоретической основы для количественной оценки неопределённости в ограниченных обратных задачах
Практическое применение: Широкие перспективы применения в физических науках, инженерии и других областях, требующих ограниченного вывода
Методологическое значение: Рамки тестирования инверсии могут вдохновить решение других статистических задач

Сценарии применения

Одновременный вывод о множественных функционалах в линейных обратных задачах
Оценивание параметров с физическими ограничениями
Научные вычисления, требующие строгих частотистских гарантий
Количественная оценка неопределённости в высокомерных ограниченных задачах оптимизации

Библиография

Статья цитирует 47 связанных работ, охватывающих важные исследования в области ограниченного вывода, обратных задач, теории оптимизации и статистики, обеспечивая прочную теоретическую основу для исследования.