2025-11-25T18:34:18.645261

Simultaneous Frequentist Calibration of Confidence Regions for Multiple Functionals in Constrained Inverse Problems

Batlle, Patil, Stanley et al.

Many scientific analyses require simultaneous comparison of multiple functionals of an unknown signal at once, calling for multidimensional confidence regions with guaranteed simultaneous frequentist under structural constraints (e.g., non-negativity, shape, or physics-based). This paper unifies and extends many previous optimization-based approaches to constrained confidence region construction in linear inverse problems through the lens of statistical test inversion. We begin by reviewing the historical development of optimization-based confidence intervals for the single-functional setting, from "strict bounds" to the Burrus conjecture and its recent refutation via the aforementioned test inversion framework. We then extend this framework to the multiple-functional setting. This framework can be used to: (i) improve the calibration constants of previous methods, yielding smaller confidence regions that still preserve frequentist coverage, (ii) obtain tractable multidimensional confidence regions that need not be hyper-rectangles to better capture functional dependence structure, and (iii) generalize beyond Gaussian error distributions to generic log-concave error distributions. We provide theory establishing nominal simultaneous coverage of our methods and show quantitative volume improvements relative to prior approaches using numerical experiments.

academic

Calibración Frecuentista Simultánea de Regiones de Confianza para Múltiples Funcionales en Problemas Inversos Restringidos

Información Básica

ID del Artículo: 2510.11708
Título: Simultaneous Frequentist Calibration of Confidence Regions for Multiple Functionals in Constrained Inverse Problems
Autores: Pau Batlle, Pratik Patil, Michael Stanley, Javier Ruiz Lupon, Houman Owhadi, Mikael Kuusela
Clasificación: math.ST stat.TH
Fecha de Publicación: 13 de octubre de 2025
Enlace del Artículo: https://arxiv.org/abs/2510.11708

Resumen

Muchos análisis científicos requieren comparar simultáneamente múltiples funcionales de una señal desconocida, lo que exige construir regiones de confianza multidimensionales con cobertura frecuentista garantizada bajo restricciones estructurales (como no negatividad, restricciones de forma o restricciones basadas en física). Este artículo unifica y extiende métodos de construcción de regiones de confianza basados en optimización en problemas inversos lineales restringidos mediante la perspectiva de inversión de pruebas estadísticas. El artículo primero revisa el desarrollo histórico de intervalos de confianza basados en optimización en el contexto de un único funcional, desde "límites estrictos simultáneos" hasta la conjetura de Burrus y su refutación reciente mediante el marco de inversión de pruebas. Luego extiende este marco al caso de múltiples funcionales. El marco puede utilizarse para: (i) mejorar las constantes de calibración de métodos previos, produciendo regiones de confianza más pequeñas manteniendo cobertura frecuentista; (ii) obtener regiones de confianza multidimensionales tratables que no necesariamente sean hiperrrectangulares, capturando mejor la estructura de dependencia entre funcionales; (iii) generalizar desde distribuciones de error gaussiano a distribuciones de error log-cóncavas generales.

Antecedentes y Motivación de la Investigación

Definición del Problema

Este artículo estudia el problema de construcción de regiones de confianza simultáneas para múltiples funcionales en problemas inversos lineales. Se considera el problema inverso lineal: $y = Kx^* + \varepsilon$ donde $y \in \mathbb{R}^n$ son las observaciones, $x^* \in \mathbb{R}^p$ es el parámetro desconocido, $K \in \mathbb{R}^{n \times p}$ es el operador directo conocido, y $\varepsilon \in \mathbb{R}^n$ es el ruido aleatorio.

Motivación de la Investigación

Necesidad Científica: Muchos análisis científicos requieren inferir simultáneamente múltiples funcionales lineales $Hx^*$ de la señal desconocida, en lugar de estimar todo el parámetro de alta dimensión $x^*$
Información de Restricciones: El parámetro verdadero $x^*$ típicamente satisface restricciones basadas en conocimiento físico previo (como no negatividad $x^* \geq 0$ )
Cobertura Simultánea: Se requiere garantizar cobertura frecuentista simultánea para todos los funcionales, no solo cobertura marginal

Limitaciones de Métodos Existentes

Conservadurismo: El método tradicional de límites estrictos simultáneos (SSB) es excesivamente conservador, construyendo primero un conjunto de confianza para $x^*$ y luego mapeándolo al espacio de funcionales
Restricción Rectangular: Los métodos existentes típicamente producen regiones de confianza hiperrrectangulares, incapaces de capturar la estructura de dependencia entre funcionales
Problemas de Calibración: Métodos históricos como la conjetura de Burrus carecen de garantías teóricas rigurosas

Contribuciones Principales

Marco Unificado: Unifica métodos de construcción de regiones de confianza restringidas para un único funcional y múltiples funcionales mediante la perspectiva de inversión de pruebas
Avances Teóricos:
- Demuestra la convexidad de las funciones de cuantiles de los estadísticos de prueba $\lambda_u^2$ y $\lambda^1$
- Determina la ubicación de la solución óptima en problemas de optimización de cuantiles
- Establece relaciones de dominancia estocástica entre estadísticos de prueba
Algoritmos Prácticos:
- Proporciona constantes de calibración óptimas para problemas con restricción de no negatividad
- Desarrolla el método de reducción TFM para problemas de alta dimensión
- Propone técnicas de separación de espacio de filas/espacio nulo
Mejora de Rendimiento: Reduce significativamente el volumen de regiones de confianza en comparación con métodos clásicos, manteniendo la tasa de cobertura nominal

Explicación Detallada del Método

Definición de la Tarea

Dada la matriz $H \in \mathbb{R}^{k \times p}$ , el objetivo es construir un conjunto de confianza frecuentista finito $1-\alpha$ $R_\alpha(y) \subseteq \mathbb{R}^k$ para el vector desconocido $Hx^* \in \mathbb{R}^k$ , tal que: $P_{y \sim P_x}(Hx \in R_\alpha(y)) \geq 1-\alpha$ se cumpla para todo $x \in \mathcal{X}$ (conjunto de restricciones).

Marco de Inversión de Pruebas

Revisión del Caso de Funcional Único

Para cada $\mu \in \mathbb{R}$ , se considera la prueba de hipótesis: $H_0: x^* \in \Phi_\mu \cap \mathcal{X} \quad \text{vs} \quad H_1: x^* \in \mathcal{X} \setminus \Phi_\mu$ donde $\Phi_\mu = \{x \in \mathbb{R}^p: h^T x = \mu\}$ .

Extensión a Múltiples Funcionales

Para $\mu \in \mathbb{R}^k$ , se define $\Phi_\mu = \{x \in \mathbb{R}^p: Hx = \mu\}$ , y la prueba de hipótesis se convierte en: $H_0: x^* \in \Phi_\mu \cap \mathcal{X} \quad \text{vs} \quad H_1: x^* \in \mathcal{X} \setminus \Phi_\mu$

Tres Estadísticos de Prueba

El artículo analiza tres estadísticos de prueba:

Término Restringido Cuadrado $\lambda_c^2(\mu, y)$ : $\lambda_c^2(\mu, y) = \min_{Hx=\mu, Ax \leq b} \|Kx - y\|_2^2 - \min_{Ax \leq b} \|Kx - y\|_2^2$
Término Sin Restricciones Cuadrado $\lambda_u^2(\mu, y)$ : $\lambda_u^2(\mu, y) = \min_{Hx=\mu, Ax \leq b} \|Kx - y\|_2^2 - \min_{x \in \mathbb{R}^p} \|Kx - y\|_2^2$
Término Único $\lambda^1(\mu, y)$ : $\lambda^1(\mu, y) = \min_{Hx=\mu, Ax \leq b} \|Kx - y\|_2^2$

Problema de Calibración

Para cada estadístico de prueba, es necesario determinar umbrales para garantizar cobertura $1-\alpha$ :

Umbral Estratificado: $d^*(\mu) = \sup_{Hx=\mu, Ax \leq b} Q_{x,1-\alpha}$
Umbral Global: $D^* = \sup_{Ax \leq b} Q_{x,1-\alpha}$

donde $Q_{x,1-\alpha}$ es el cuantil $(1-\alpha)$ de $Z_x = \lambda(Hx, Kx + \varepsilon)$ .

Resultados Teóricos Clave

Teorema de Convexidad

Teorema 5.4: Para cualquier $0 < \alpha < 1$ fijo, la función de cuantiles $Q_u^2(x)$ es convexa en $x$ .

Teorema de Maximización

Teorema 5.6 (Restricciones Lineales): Bajo restricciones lineales $Ax^* \leq b$ , $\sup_{x \in P} Q_u^2(x) = \max_{i=1:m} Q_u^2(p_i)$ donde $\{p_i\}_{i=1}^m$ es el conjunto de puntos extremos del poliedro $P$ .

Teorema 5.7 (Restricciones Cónicas): Bajo restricciones cónicas $x^* \in C$ , $\sup_{x \in C} Q_u^2(x) = Q_u^2(0)$

Configuración Experimental

Ejemplos Numéricos

Se considera un problema con restricción de no negatividad: $y = Kx + \varepsilon, \quad \varepsilon \sim N(0, I), \quad x^* \geq 0$ donde: $K = \begin{pmatrix} 2 & 1 & 1 \\ 0 & 1 & 1 \end{pmatrix}, \quad H = \begin{pmatrix} 1 & -1 & 0 \\ 0 & 1 & -1 \end{pmatrix}$

Métodos de Comparación

SSB_x: Caja delimitadora de descripción $x$ de límites estrictos simultáneos
SSB_μ: Descripción $\mu$ de límites estrictos simultáneos
QuantileZero_x/μ: Versión mejorada usando constantes óptimas
Bonferroni: Intervalos de producto con corrección de Bonferroni
Método Split: Técnica de separación de espacio de filas/espacio nulo

Métricas de Evaluación

Tasa de Cobertura Empírica: Verificada mediante $N = 10^5$ remuestreos
Área de Región: Calculada usando integración en coordenadas polares

Resultados Experimentales

Resultados Principales

Regiones de Confianza para Observaciones Fijas

Para $y = (0,0)$ e $y = (20,10)$ , el método de descripción $\mu$ produce conjuntos convexos estrictamente contenidos en las cajas delimitadoras de descripción $x$ , reduciendo significativamente el área de la región.

Distribución de Cobertura y Área

$x^* = (0,0,0)$ : El método QuantileZero_μ logra una tasa de cobertura aproximadamente exacta del 68%, con área promedio mínima
$x^* = (5,5,5)$ : Todos los métodos alcanzan cobertura, pero el método de descripción $\mu$ mantiene ventajas significativas en área

Mejoras Cuantificadas

Mejora de Constantes de Calibración: Para niveles de confianza del 68% y 95%, las constantes óptimas son 1.644 y 5.139 respectivamente, mostrando mejoras significativas sobre los valores 2.279 y 5.991 de la distribución $\chi^2_2$
Reducción de Área: La descripción $\mu$ reduce el área promedio en comparación con la caja delimitadora de descripción $x$ en aproximadamente 30-50%

Trabajo Relacionado

Desarrollo Histórico

Burrus (1964): Propone por primera vez métodos de optimización para intervalos de confianza restringidos
Rust & O'Leary (1986): Desarrollan algoritmos prácticos
Stark (1992): Propone el método de límites estrictos
Tenorio et al. (2007): Desarrollan la técnica de reducción TFM

Avances Modernos

Batlle et al. (2023): Refutan la conjetura de Burrus mediante el marco de inversión de pruebas
Literatura de Inferencia Restringida: Conexiones con la teoría de distribuciones $\chi^2$ -bar
Predicción Conforme: Diferencias en objetivos e hipótesis

Conclusiones y Discusión

Conclusiones Principales

Contribuciones Teóricas: Establece un marco unificado de inversión de pruebas para regiones de confianza de múltiples funcionales restringidos
Ventajas Computacionales: Proporciona algoritmos escalables para problemas de alta dimensión
Mejora de Rendimiento: Reduce significativamente el volumen de regiones de confianza en comparación con métodos clásicos

Limitaciones

Estadístico $\lambda_c^2$ : La función de cuantiles carece de convexidad, el problema de maximización permanece abierto
Complejidad Computacional: La búsqueda de puntos extremos en casos de alta dimensión puede ser difícil
Umbrales Estratificados: Calcular la función completa $d^*(\mu)$ típicamente presenta desafíos

Direcciones Futuras

Extensión No Gaussiana: Extender a distribuciones log-cóncavas generales
Calibración de $\lambda_c^2$ : Desarrollar algoritmos de calibración para el estadístico de término restringido cuadrado
Teoría Asintótica: Investigar propiedades de muestras grandes
Campos de Aplicación: Extender a restricciones de forma y otros problemas estadísticos

Evaluación Profunda

Fortalezas

Rigor Teórico: Proporciona un marco matemático completo, incluyendo pruebas de convexidad y resultados de optimalidad
Valor Práctico: Desarrolla algoritmos escalables que resuelven problemas reales de alta dimensión
Perspectiva Unificada: Unifica métodos históricamente dispersos bajo el marco de inversión de pruebas
Mejoras Significativas: Reduce sustancialmente las regiones de confianza manteniendo garantías teóricas

Insuficiencias

Vacíos Teóricos: La teoría completa del estadístico $\lambda_c^2$ aún no se ha establecido
Limitaciones Computacionales: Complejidad computacional en ciertos casos de alta dimensión
Alcance Experimental: Los experimentos numéricos son relativamente simples, careciendo de aplicaciones reales complejas

Impacto

Contribución Académica: Proporciona nuevas bases teóricas para la cuantificación de incertidumbre en problemas inversos restringidos
Aplicaciones Prácticas: Perspectivas amplias de aplicación en ciencias físicas, ingeniería y otros campos que requieren inferencia restringida
Significado Metodológico: El marco de inversión de pruebas puede inspirar soluciones a otros problemas estadísticos

Escenarios Aplicables

Inferencia simultánea de múltiples funcionales en problemas inversos lineales
Estimación de parámetros con restricciones físicas
Computación científica que requiere garantías frecuentistas rigurosas
Cuantificación de incertidumbre en problemas de optimización restringida de alta dimensión

Referencias

El artículo cita 47 referencias relacionadas, cubriendo trabajos importantes en múltiples campos incluyendo inferencia restringida, problemas inversos, teoría de optimización y estadística, proporcionando una base teórica sólida para la investigación.