2025-11-25T18:34:18.645261

Simultaneous Frequentist Calibration of Confidence Regions for Multiple Functionals in Constrained Inverse Problems

Batlle, Patil, Stanley et al.
Many scientific analyses require simultaneous comparison of multiple functionals of an unknown signal at once, calling for multidimensional confidence regions with guaranteed simultaneous frequentist under structural constraints (e.g., non-negativity, shape, or physics-based). This paper unifies and extends many previous optimization-based approaches to constrained confidence region construction in linear inverse problems through the lens of statistical test inversion. We begin by reviewing the historical development of optimization-based confidence intervals for the single-functional setting, from "strict bounds" to the Burrus conjecture and its recent refutation via the aforementioned test inversion framework. We then extend this framework to the multiple-functional setting. This framework can be used to: (i) improve the calibration constants of previous methods, yielding smaller confidence regions that still preserve frequentist coverage, (ii) obtain tractable multidimensional confidence regions that need not be hyper-rectangles to better capture functional dependence structure, and (iii) generalize beyond Gaussian error distributions to generic log-concave error distributions. We provide theory establishing nominal simultaneous coverage of our methods and show quantitative volume improvements relative to prior approaches using numerical experiments.
academic

Simultaneous Frequentist Calibration of Confidence Regions for Multiple Functionals in Constrained Inverse Problems

基本信息

  • 论文ID: 2510.11708
  • 标题: Simultaneous Frequentist Calibration of Confidence Regions for Multiple Functionals in Constrained Inverse Problems
  • 作者: Pau Batlle, Pratik Patil, Michael Stanley, Javier Ruiz Lupon, Houman Owhadi, Mikael Kuusela
  • 分类: math.ST stat.TH
  • 发表时间: 2025年10月13日
  • 论文链接: https://arxiv.org/abs/2510.11708

摘要

许多科学分析需要同时比较未知信号的多个泛函,这要求在结构约束(如非负性、形状或基于物理的约束)下构造具有保证同时频率主义覆盖的多维置信区域。本文通过统计检验反演的视角,统一并扩展了约束线性逆问题中基于优化的置信区域构造方法。论文首先回顾了单泛函设置下基于优化的置信区间的历史发展,从"严格界"到Burrus猜想及其最近通过检验反演框架的反驳。然后将该框架扩展到多泛函设置。该框架可用于:(i) 改进先前方法的校准常数,产生更小但仍保持频率主义覆盖的置信区域;(ii) 获得不必是超矩形的可处理多维置信区域,以更好地捕获泛函依赖结构;(iii) 从高斯误差分布推广到一般对数凹误差分布。

研究背景与动机

问题定义

本文研究线性逆问题中多个泛函的同时置信区域构造问题。考虑线性逆问题: y=Kx+εy = Kx^* + \varepsilon 其中 yRny \in \mathbb{R}^n 是观测值,xRpx^* \in \mathbb{R}^p 是未知参数,KRn×pK \in \mathbb{R}^{n \times p} 是已知前向算子,εRn\varepsilon \in \mathbb{R}^n 是随机噪声。

研究动机

  1. 科学需求:许多科学分析需要同时推断未知信号的多个线性泛函 HxHx^*,而不是估计整个高维参数 xx^*
  2. 约束信息:真实参数 xx^* 通常满足基于先验物理知识的约束(如非负性 x0x^* \geq 0
  3. 同时覆盖:需要保证所有泛函的同时频率主义覆盖,而非边际覆盖

现有方法局限性

  1. 保守性:传统的同时严格界(SSB)方法过于保守,首先构造 xx^* 的置信集,然后映射到泛函空间
  2. 矩形限制:现有方法通常产生超矩形置信区域,无法捕获泛函间的依赖结构
  3. 校准问题:历史上的Burrus猜想等方法缺乏严格的理论保证

核心贡献

  1. 统一框架:通过检验反演视角统一了单泛函和多泛函约束置信区域构造方法
  2. 理论突破
    • 证明了 λu2\lambda_u^2λ1\lambda^1 检验统计量对应量分位函数的凸性
    • 确定了量分位优化问题的最优解位置
    • 建立了检验统计量间的随机占优关系
  3. 实用算法
    • 为非负约束问题提供了最优校准常数
    • 开发了高维问题的TFM约简方法
    • 提出了行空间/零空间分离技术
  4. 性能提升:相比经典方法显著减小了置信区域体积,同时保持名义覆盖率

方法详解

任务定义

给定矩阵 HRk×pH \in \mathbb{R}^{k \times p},目标是为未知向量 HxRkHx^* \in \mathbb{R}^k 构造有限样本 1α1-\alpha 频率主义置信集 Rα(y)RkR_\alpha(y) \subseteq \mathbb{R}^k,使得: PyPx(HxRα(y))1αP_{y \sim P_x}(Hx \in R_\alpha(y)) \geq 1-\alpha 对所有 xXx \in \mathcal{X}(约束集)都成立。

检验反演框架

单泛函情况回顾

对每个 μR\mu \in \mathbb{R},考虑假设检验: H0:xΦμXvsH1:xXΦμH_0: x^* \in \Phi_\mu \cap \mathcal{X} \quad \text{vs} \quad H_1: x^* \in \mathcal{X} \setminus \Phi_\mu 其中 Φμ={xRp:hTx=μ}\Phi_\mu = \{x \in \mathbb{R}^p: h^T x = \mu\}

多泛函扩展

μRk\mu \in \mathbb{R}^k,定义 Φμ={xRp:Hx=μ}\Phi_\mu = \{x \in \mathbb{R}^p: Hx = \mu\},假设检验变为: H0:xΦμXvsH1:xXΦμH_0: x^* \in \Phi_\mu \cap \mathcal{X} \quad \text{vs} \quad H_1: x^* \in \mathcal{X} \setminus \Phi_\mu

三种检验统计量

论文分析了三种检验统计量:

  1. 约束第二项 λc2(μ,y)\lambda_c^2(\mu, y)λc2(μ,y)=minHx=μ,AxbKxy22minAxbKxy22\lambda_c^2(\mu, y) = \min_{Hx=\mu, Ax \leq b} \|Kx - y\|_2^2 - \min_{Ax \leq b} \|Kx - y\|_2^2
  2. 无约束第二项 λu2(μ,y)\lambda_u^2(\mu, y)λu2(μ,y)=minHx=μ,AxbKxy22minxRpKxy22\lambda_u^2(\mu, y) = \min_{Hx=\mu, Ax \leq b} \|Kx - y\|_2^2 - \min_{x \in \mathbb{R}^p} \|Kx - y\|_2^2
  3. 单项 λ1(μ,y)\lambda^1(\mu, y)λ1(μ,y)=minHx=μ,AxbKxy22\lambda^1(\mu, y) = \min_{Hx=\mu, Ax \leq b} \|Kx - y\|_2^2

校准问题

对每种检验统计量,需要确定阈值以保证 1α1-\alpha 覆盖率:

  • 分片阈值d(μ)=supHx=μ,AxbQx,1αd^*(\mu) = \sup_{Hx=\mu, Ax \leq b} Q_{x,1-\alpha}
  • 全局阈值D=supAxbQx,1αD^* = \sup_{Ax \leq b} Q_{x,1-\alpha}

其中 Qx,1αQ_{x,1-\alpha}Zx=λ(Hx,Kx+ε)Z_x = \lambda(Hx, Kx + \varepsilon)(1α)(1-\alpha) 分位数。

关键理论结果

凸性定理

定理 5.4:对任意固定 0<α<10 < \alpha < 1,量分位函数 Qu2(x)Q_u^2(x)xx 的凸函数。

最大化定理

定理 5.6(线性约束):在线性约束 AxbAx^* \leq b 下, supxPQu2(x)=maxi=1:mQu2(pi)\sup_{x \in P} Q_u^2(x) = \max_{i=1:m} Q_u^2(p_i) 其中 {pi}i=1m\{p_i\}_{i=1}^m 是多面体 PP 的极值点集合。

定理 5.7(锥约束):在锥约束 xCx^* \in C 下, supxCQu2(x)=Qu2(0)\sup_{x \in C} Q_u^2(x) = Q_u^2(0)

实验设置

数值实例

考虑非负约束问题: y=Kx+ε,εN(0,I),x0y = Kx + \varepsilon, \quad \varepsilon \sim N(0, I), \quad x^* \geq 0 其中: K=(211011),H=(110011)K = \begin{pmatrix} 2 & 1 & 1 \\ 0 & 1 & 1 \end{pmatrix}, \quad H = \begin{pmatrix} 1 & -1 & 0 \\ 0 & 1 & -1 \end{pmatrix}

对比方法

  1. SSB_x:同时严格界的 xx-描述边界框
  2. SSB_μ:同时严格界的 μ\mu-描述
  3. QuantileZero_x/μ:使用最优常数的改进版本
  4. Bonferroni:Bonferroni校正的乘积区间
  5. Split方法:行空间/零空间分离技术

评价指标

  • 经验覆盖率:通过 N=105N = 10^5 次重采样验证
  • 区域面积:使用极坐标积分计算置信区域面积

实验结果

主要结果

固定观测值的置信区域

对于 y=(0,0)y = (0,0)y=(20,10)y = (20,10)μ\mu-描述方法产生的凸集严格包含于 xx-描述边界框内,显著减小了区域面积。

覆盖率和面积分布

  • x=(0,0,0)x^* = (0,0,0):QuantileZero_μ 方法达到近似精确的68%覆盖率,平均面积最小
  • x=(5,5,5)x^* = (5,5,5):所有方法都出现过覆盖,但 μ\mu-描述方法在面积上仍有显著优势

量化改进

  1. 校准常数改进:对于68%和95%置信水平,最优常数分别为1.644和5.139,相比 χ22\chi^2_2 分布的2.279和5.991有显著改进
  2. 面积减少μ\mu-描述相比 xx-描述边界框平均面积减少约30-50%

相关工作

历史发展

  1. Burrus (1964):首次提出约束置信区间的优化方法
  2. Rust & O'Leary (1986):开发了实用算法
  3. Stark (1992):提出严格界方法
  4. Tenorio等 (2007):发展了TFM约简技术

现代进展

  • Batlle等 (2023):通过检验反演框架反驳了Burrus猜想
  • 约束推断文献:与 χ2\chi^2-bar 分布理论的联系
  • 保形预测:在目标和假设上的区别

结论与讨论

主要结论

  1. 理论贡献:建立了多泛函约束置信区域的统一检验反演框架
  2. 计算优势:提供了高维问题的可扩展算法
  3. 性能提升:相比经典方法显著减小置信区域体积

局限性

  1. λc2\lambda_c^2 统计量:量分位函数缺乏凸性,最大化问题仍然开放
  2. 计算复杂性:高维情况下极值点搜索可能困难
  3. 分片阈值:计算整个函数 d(μ)d^*(\mu) 通常具有挑战性

未来方向

  1. 非高斯扩展:扩展到一般对数凹分布
  2. λc2\lambda_c^2 校准:开发约束第二项统计量的校准算法
  3. 渐近理论:研究大样本性质
  4. 应用领域:扩展到形状约束和其他统计问题

深度评价

优点

  1. 理论严谨性:提供了完整的数学理论框架,包括凸性证明和最优性结果
  2. 实用价值:开发了可扩展的算法,解决了高维实际问题
  3. 统一视角:将历史上分散的方法统一在检验反演框架下
  4. 显著改进:在保持理论保证的同时大幅减小置信区域

不足

  1. 理论空白λc2\lambda_c^2 统计量的完整理论仍未建立
  2. 计算限制:某些高维情况下的计算复杂性
  3. 实验范围:数值实验相对简单,缺乏复杂实际应用

影响力

  1. 学术贡献:为约束逆问题的不确定性量化提供了新的理论基础
  2. 实际应用:在物理科学、工程和其他需要约束推断的领域有广泛应用前景
  3. 方法论意义:检验反演框架可能启发其他统计问题的解决

适用场景

  • 线性逆问题中的多泛函同时推断
  • 具有物理约束的参数估计
  • 需要严格频率主义保证的科学计算
  • 高维约束优化问题的不确定性量化

参考文献

论文引用了47篇相关文献,涵盖了约束推断、逆问题、优化理论和统计学等多个领域的重要工作,为研究提供了坚实的理论基础。