2025-11-25T18:34:18.645261

Simultaneous Frequentist Calibration of Confidence Regions for Multiple Functionals in Constrained Inverse Problems

Batlle, Patil, Stanley et al.

Many scientific analyses require simultaneous comparison of multiple functionals of an unknown signal at once, calling for multidimensional confidence regions with guaranteed simultaneous frequentist under structural constraints (e.g., non-negativity, shape, or physics-based). This paper unifies and extends many previous optimization-based approaches to constrained confidence region construction in linear inverse problems through the lens of statistical test inversion. We begin by reviewing the historical development of optimization-based confidence intervals for the single-functional setting, from "strict bounds" to the Burrus conjecture and its recent refutation via the aforementioned test inversion framework. We then extend this framework to the multiple-functional setting. This framework can be used to: (i) improve the calibration constants of previous methods, yielding smaller confidence regions that still preserve frequentist coverage, (ii) obtain tractable multidimensional confidence regions that need not be hyper-rectangles to better capture functional dependence structure, and (iii) generalize beyond Gaussian error distributions to generic log-concave error distributions. We provide theory establishing nominal simultaneous coverage of our methods and show quantitative volume improvements relative to prior approaches using numerical experiments.

academic

제약 역문제에서 다중 함수에 대한 신뢰 영역의 동시 빈도주의 보정

기본 정보

논문 ID: 2510.11708
제목: Simultaneous Frequentist Calibration of Confidence Regions for Multiple Functionals in Constrained Inverse Problems
저자: Pau Batlle, Pratik Patil, Michael Stanley, Javier Ruiz Lupon, Houman Owhadi, Mikael Kuusela
분류: math.ST stat.TH
발표 시간: 2025년 10월 13일
논문 링크: https://arxiv.org/abs/2510.11708

초록

많은 과학 분석에서는 미지의 신호에 대한 다중 함수를 동시에 비교해야 하며, 이는 비음성, 형태 또는 물리 기반 제약과 같은 구조적 제약 하에서 보장된 동시 빈도주의 적용 범위를 갖는 다차원 신뢰 영역을 구성해야 합니다. 본 논문은 통계적 검정 반전의 관점을 통해 제약 선형 역문제에서 최적화 기반 신뢰 영역 구성 방법을 통일하고 확장합니다. 먼저 단일 함수 설정에서 최적화 기반 신뢰 구간의 역사적 발전을 검토하며, "엄격한 경계"에서 Burrus 추측 및 최근 검정 반전 프레임워크를 통한 반박까지 다룹니다. 그 후 이 프레임워크를 다중 함수 설정으로 확장합니다. 본 프레임워크는 다음을 가능하게 합니다: (i) 이전 방법의 보정 상수를 개선하여 더 작지만 여전히 빈도주의 적용 범위를 유지하는 신뢰 영역 생성; (ii) 초직육면체일 필요가 없는 다루기 쉬운 다차원 신뢰 영역 획득으로 함수 종속 구조를 더 잘 포착; (iii) 가우스 오차 분포에서 일반 로그오목 오차 분포로의 일반화.

연구 배경 및 동기

문제 정의

본 논문은 선형 역문제에서 다중 함수의 동시 신뢰 영역 구성 문제를 연구합니다. 선형 역문제를 고려합니다: $y = Kx^* + \varepsilon$ 여기서 $y \in \mathbb{R}^n$ 은 관측값, $x^* \in \mathbb{R}^p$ 는 미지의 매개변수, $K \in \mathbb{R}^{n \times p}$ 는 알려진 전진 연산자, $\varepsilon \in \mathbb{R}^n$ 은 무작위 잡음입니다.

연구 동기

과학적 필요성: 많은 과학 분석에서는 전체 고차원 매개변수 $x^*$ 를 추정하는 대신 미지의 신호의 다중 선형 함수 $Hx^*$ 를 동시에 추론해야 합니다.
제약 정보: 실제 매개변수 $x^*$ 는 일반적으로 사전 물리 지식을 기반으로 한 제약(예: 비음성 $x^* \geq 0$ )을 만족합니다.
동시 적용 범위: 주변 적용 범위가 아닌 모든 함수의 동시 빈도주의 적용 범위를 보장해야 합니다.

기존 방법의 한계

보수성: 전통적인 동시 엄격한 경계(SSB) 방법은 과도하게 보수적이며, 먼저 $x^*$ 의 신뢰 집합을 구성한 후 함수 공간으로 매핑합니다.
직육면체 제한: 기존 방법은 일반적으로 초직육면체 신뢰 영역을 생성하여 함수 간의 종속 구조를 포착할 수 없습니다.
보정 문제: 역사적으로 Burrus 추측 등의 방법은 엄격한 이론적 보장이 부족합니다.

핵심 기여

통일된 프레임워크: 검정 반전 관점을 통해 단일 함수 및 다중 함수 제약 신뢰 영역 구성 방법을 통일합니다.
이론적 돌파구:
- $\lambda_u^2$ 및 $\lambda^1$ 검정 통계량의 대응 분위수 함수의 볼록성을 증명합니다.
- 분위수 최적화 문제의 최적 해 위치를 결정합니다.
- 검정 통계량 간의 확률적 우월 관계를 확립합니다.
실용적 알고리즘:
- 비음성 제약 문제에 대한 최적 보정 상수를 제공합니다.
- 고차원 문제를 위한 TFM 축소 방법을 개발합니다.
- 행 공간/영공간 분리 기술을 제안합니다.
성능 향상: 명목 적용 범위를 유지하면서 고전적 방법에 비해 신뢰 영역 부피를 크게 감소시킵니다.

방법 상세 설명

작업 정의

행렬 $H \in \mathbb{R}^{k \times p}$ 가 주어졌을 때, 목표는 미지의 벡터 $Hx^* \in \mathbb{R}^k$ 에 대한 유한 표본 $1-\alpha$ 빈도주의 신뢰 집합 $R_\alpha(y) \subseteq \mathbb{R}^k$ 를 구성하는 것입니다: $P_{y \sim P_x}(Hx \in R_\alpha(y)) \geq 1-\alpha$ 모든 $x \in \mathcal{X}$ (제약 집합)에 대해 성립합니다.

검정 반전 프레임워크

단일 함수 경우 검토

각 $\mu \in \mathbb{R}$ 에 대해 가설 검정을 고려합니다: $H_0: x^* \in \Phi_\mu \cap \mathcal{X} \quad \text{vs} \quad H_1: x^* \in \mathcal{X} \setminus \Phi_\mu$ 여기서 $\Phi_\mu = \{x \in \mathbb{R}^p: h^T x = \mu\}$ 입니다.

다중 함수 확장

$\mu \in \mathbb{R}^k$ 에 대해 $\Phi_\mu = \{x \in \mathbb{R}^p: Hx = \mu\}$ 를 정의하면, 가설 검정은 다음과 같이 됩니다: $H_0: x^* \in \Phi_\mu \cap \mathcal{X} \quad \text{vs} \quad H_1: x^* \in \mathcal{X} \setminus \Phi_\mu$

세 가지 검정 통계량

논문은 세 가지 검정 통계량을 분석합니다:

제약 제2항 $\lambda_c^2(\mu, y)$ : $\lambda_c^2(\mu, y) = \min_{Hx=\mu, Ax \leq b} \|Kx - y\|_2^2 - \min_{Ax \leq b} \|Kx - y\|_2^2$
비제약 제2항 $\lambda_u^2(\mu, y)$ : $\lambda_u^2(\mu, y) = \min_{Hx=\mu, Ax \leq b} \|Kx - y\|_2^2 - \min_{x \in \mathbb{R}^p} \|Kx - y\|_2^2$
단일항 $\lambda^1(\mu, y)$ : $\lambda^1(\mu, y) = \min_{Hx=\mu, Ax \leq b} \|Kx - y\|_2^2$

보정 문제

각 검정 통계량에 대해 $1-\alpha$ 적용 범위를 보장하기 위한 임계값을 결정해야 합니다:

분할 임계값: $d^*(\mu) = \sup_{Hx=\mu, Ax \leq b} Q_{x,1-\alpha}$
전역 임계값: $D^* = \sup_{Ax \leq b} Q_{x,1-\alpha}$

여기서 $Q_{x,1-\alpha}$ 는 $Z_x = \lambda(Hx, Kx + \varepsilon)$ 의 $(1-\alpha)$ 분위수입니다.

SSB_x: 동시 엄격한 경계의 $x$ -설명 경계 상자
SSB_μ: 동시 엄격한 경계의 $\mu$ -설명
QuantileZero_x/μ: 최적 상수를 사용한 개선된 버전
Bonferroni: Bonferroni 보정의 곱 구간
Split 방법: 행 공간/영공간 분리 기술

평가 지표

경험적 적용 범위: $N = 10^5$ 회 재표본을 통해 검증
영역 면적: 극좌표 적분을 사용하여 신뢰 영역 면적 계산

$x^* = (0,0,0)$ : QuantileZero_μ 방법은 약 68%의 거의 정확한 적용 범위를 달성하며 평균 면적이 최소입니다.
$x^* = (5,5,5)$ : 모든 방법이 적용 범위를 초과하지만, $\mu$ -설명 방법은 면적에서 여전히 현저한 이점을 가집니다.

정량적 개선

보정 상수 개선: 68% 및 95% 신뢰 수준의 경우, 최적 상수는 각각 1.644 및 5.139이며, $\chi^2_2$ 분포의 2.279 및 5.991과 비교하여 현저한 개선입니다.
면적 감소: $\mu$ -설명은 $x$ -설명 경계 상자에 비해 평균 면적이 약 30-50% 감소합니다.