Many scientific analyses require simultaneous comparison of multiple functionals of an unknown signal at once, calling for multidimensional confidence regions with guaranteed simultaneous frequentist under structural constraints (e.g., non-negativity, shape, or physics-based). This paper unifies and extends many previous optimization-based approaches to constrained confidence region construction in linear inverse problems through the lens of statistical test inversion. We begin by reviewing the historical development of optimization-based confidence intervals for the single-functional setting, from "strict bounds" to the Burrus conjecture and its recent refutation via the aforementioned test inversion framework. We then extend this framework to the multiple-functional setting. This framework can be used to: (i) improve the calibration constants of previous methods, yielding smaller confidence regions that still preserve frequentist coverage, (ii) obtain tractable multidimensional confidence regions that need not be hyper-rectangles to better capture functional dependence structure, and (iii) generalize beyond Gaussian error distributions to generic log-concave error distributions. We provide theory establishing nominal simultaneous coverage of our methods and show quantitative volume improvements relative to prior approaches using numerical experiments.
- 论文ID: 2510.11708
- 标题: Simultaneous Frequentist Calibration of Confidence Regions for Multiple Functionals in Constrained Inverse Problems
- 作者: Pau Batlle, Pratik Patil, Michael Stanley, Javier Ruiz Lupon, Houman Owhadi, Mikael Kuusela
- 分类: math.ST stat.TH
- 发表时间: 2025年10月13日
- 论文链接: https://arxiv.org/abs/2510.11708
许多科学分析需要同时比较未知信号的多个泛函,这要求在结构约束(如非负性、形状或基于物理的约束)下构造具有保证同时频率主义覆盖的多维置信区域。本文通过统计检验反演的视角,统一并扩展了约束线性逆问题中基于优化的置信区域构造方法。论文首先回顾了单泛函设置下基于优化的置信区间的历史发展,从"严格界"到Burrus猜想及其最近通过检验反演框架的反驳。然后将该框架扩展到多泛函设置。该框架可用于:(i) 改进先前方法的校准常数,产生更小但仍保持频率主义覆盖的置信区域;(ii) 获得不必是超矩形的可处理多维置信区域,以更好地捕获泛函依赖结构;(iii) 从高斯误差分布推广到一般对数凹误差分布。
本文研究线性逆问题中多个泛函的同时置信区域构造问题。考虑线性逆问题:
y=Kx∗+ε
其中 y∈Rn 是观测值,x∗∈Rp 是未知参数,K∈Rn×p 是已知前向算子,ε∈Rn 是随机噪声。
- 科学需求:许多科学分析需要同时推断未知信号的多个线性泛函 Hx∗,而不是估计整个高维参数 x∗
- 约束信息:真实参数 x∗ 通常满足基于先验物理知识的约束(如非负性 x∗≥0)
- 同时覆盖:需要保证所有泛函的同时频率主义覆盖,而非边际覆盖
- 保守性:传统的同时严格界(SSB)方法过于保守,首先构造 x∗ 的置信集,然后映射到泛函空间
- 矩形限制:现有方法通常产生超矩形置信区域,无法捕获泛函间的依赖结构
- 校准问题:历史上的Burrus猜想等方法缺乏严格的理论保证
- 统一框架:通过检验反演视角统一了单泛函和多泛函约束置信区域构造方法
- 理论突破:
- 证明了 λu2 和 λ1 检验统计量对应量分位函数的凸性
- 确定了量分位优化问题的最优解位置
- 建立了检验统计量间的随机占优关系
- 实用算法:
- 为非负约束问题提供了最优校准常数
- 开发了高维问题的TFM约简方法
- 提出了行空间/零空间分离技术
- 性能提升:相比经典方法显著减小了置信区域体积,同时保持名义覆盖率
给定矩阵 H∈Rk×p,目标是为未知向量 Hx∗∈Rk 构造有限样本 1−α 频率主义置信集 Rα(y)⊆Rk,使得:
Py∼Px(Hx∈Rα(y))≥1−α
对所有 x∈X(约束集)都成立。
对每个 μ∈R,考虑假设检验:
H0:x∗∈Φμ∩XvsH1:x∗∈X∖Φμ
其中 Φμ={x∈Rp:hTx=μ}。
对 μ∈Rk,定义 Φμ={x∈Rp:Hx=μ},假设检验变为:
H0:x∗∈Φμ∩XvsH1:x∗∈X∖Φμ
论文分析了三种检验统计量:
- 约束第二项 λc2(μ,y):
λc2(μ,y)=minHx=μ,Ax≤b∥Kx−y∥22−minAx≤b∥Kx−y∥22
- 无约束第二项 λu2(μ,y):
λu2(μ,y)=minHx=μ,Ax≤b∥Kx−y∥22−minx∈Rp∥Kx−y∥22
- 单项 λ1(μ,y):
λ1(μ,y)=minHx=μ,Ax≤b∥Kx−y∥22
对每种检验统计量,需要确定阈值以保证 1−α 覆盖率:
- 分片阈值:d∗(μ)=supHx=μ,Ax≤bQx,1−α
- 全局阈值:D∗=supAx≤bQx,1−α
其中 Qx,1−α 是 Zx=λ(Hx,Kx+ε) 的 (1−α) 分位数。
定理 5.4:对任意固定 0<α<1,量分位函数 Qu2(x) 是 x 的凸函数。
定理 5.6(线性约束):在线性约束 Ax∗≤b 下,
supx∈PQu2(x)=maxi=1:mQu2(pi)
其中 {pi}i=1m 是多面体 P 的极值点集合。
定理 5.7(锥约束):在锥约束 x∗∈C 下,
supx∈CQu2(x)=Qu2(0)
考虑非负约束问题:
y=Kx+ε,ε∼N(0,I),x∗≥0
其中:
K=(201111),H=(10−110−1)
- SSB_x:同时严格界的 x-描述边界框
- SSB_μ:同时严格界的 μ-描述
- QuantileZero_x/μ:使用最优常数的改进版本
- Bonferroni:Bonferroni校正的乘积区间
- Split方法:行空间/零空间分离技术
- 经验覆盖率:通过 N=105 次重采样验证
- 区域面积:使用极坐标积分计算置信区域面积
对于 y=(0,0) 和 y=(20,10),μ-描述方法产生的凸集严格包含于 x-描述边界框内,显著减小了区域面积。
- x∗=(0,0,0):QuantileZero_μ 方法达到近似精确的68%覆盖率,平均面积最小
- x∗=(5,5,5):所有方法都出现过覆盖,但 μ-描述方法在面积上仍有显著优势
- 校准常数改进:对于68%和95%置信水平,最优常数分别为1.644和5.139,相比 χ22 分布的2.279和5.991有显著改进
- 面积减少:μ-描述相比 x-描述边界框平均面积减少约30-50%
- Burrus (1964):首次提出约束置信区间的优化方法
- Rust & O'Leary (1986):开发了实用算法
- Stark (1992):提出严格界方法
- Tenorio等 (2007):发展了TFM约简技术
- Batlle等 (2023):通过检验反演框架反驳了Burrus猜想
- 约束推断文献:与 χ2-bar 分布理论的联系
- 保形预测:在目标和假设上的区别
- 理论贡献:建立了多泛函约束置信区域的统一检验反演框架
- 计算优势:提供了高维问题的可扩展算法
- 性能提升:相比经典方法显著减小置信区域体积
- λc2 统计量:量分位函数缺乏凸性,最大化问题仍然开放
- 计算复杂性:高维情况下极值点搜索可能困难
- 分片阈值:计算整个函数 d∗(μ) 通常具有挑战性
- 非高斯扩展:扩展到一般对数凹分布
- λc2 校准:开发约束第二项统计量的校准算法
- 渐近理论:研究大样本性质
- 应用领域:扩展到形状约束和其他统计问题
- 理论严谨性:提供了完整的数学理论框架,包括凸性证明和最优性结果
- 实用价值:开发了可扩展的算法,解决了高维实际问题
- 统一视角:将历史上分散的方法统一在检验反演框架下
- 显著改进:在保持理论保证的同时大幅减小置信区域
- 理论空白:λc2 统计量的完整理论仍未建立
- 计算限制:某些高维情况下的计算复杂性
- 实验范围:数值实验相对简单,缺乏复杂实际应用
- 学术贡献:为约束逆问题的不确定性量化提供了新的理论基础
- 实际应用:在物理科学、工程和其他需要约束推断的领域有广泛应用前景
- 方法论意义:检验反演框架可能启发其他统计问题的解决
- 线性逆问题中的多泛函同时推断
- 具有物理约束的参数估计
- 需要严格频率主义保证的科学计算
- 高维约束优化问题的不确定性量化
论文引用了47篇相关文献,涵盖了约束推断、逆问题、优化理论和统计学等多个领域的重要工作,为研究提供了坚实的理论基础。