2025-11-25T18:34:18.645261

Simultaneous Frequentist Calibration of Confidence Regions for Multiple Functionals in Constrained Inverse Problems

Batlle, Patil, Stanley et al.
Many scientific analyses require simultaneous comparison of multiple functionals of an unknown signal at once, calling for multidimensional confidence regions with guaranteed simultaneous frequentist under structural constraints (e.g., non-negativity, shape, or physics-based). This paper unifies and extends many previous optimization-based approaches to constrained confidence region construction in linear inverse problems through the lens of statistical test inversion. We begin by reviewing the historical development of optimization-based confidence intervals for the single-functional setting, from "strict bounds" to the Burrus conjecture and its recent refutation via the aforementioned test inversion framework. We then extend this framework to the multiple-functional setting. This framework can be used to: (i) improve the calibration constants of previous methods, yielding smaller confidence regions that still preserve frequentist coverage, (ii) obtain tractable multidimensional confidence regions that need not be hyper-rectangles to better capture functional dependence structure, and (iii) generalize beyond Gaussian error distributions to generic log-concave error distributions. We provide theory establishing nominal simultaneous coverage of our methods and show quantitative volume improvements relative to prior approaches using numerical experiments.
academic

Calibración Frecuentista Simultánea de Regiones de Confianza para Múltiples Funcionales en Problemas Inversos Restringidos

Información Básica

  • ID del Artículo: 2510.11708
  • Título: Simultaneous Frequentist Calibration of Confidence Regions for Multiple Functionals in Constrained Inverse Problems
  • Autores: Pau Batlle, Pratik Patil, Michael Stanley, Javier Ruiz Lupon, Houman Owhadi, Mikael Kuusela
  • Clasificación: math.ST stat.TH
  • Fecha de Publicación: 13 de octubre de 2025
  • Enlace del Artículo: https://arxiv.org/abs/2510.11708

Resumen

Muchos análisis científicos requieren comparar simultáneamente múltiples funcionales de una señal desconocida, lo que exige construir regiones de confianza multidimensionales con cobertura frecuentista garantizada bajo restricciones estructurales (como no negatividad, restricciones de forma o restricciones basadas en física). Este artículo unifica y extiende métodos de construcción de regiones de confianza basados en optimización en problemas inversos lineales restringidos mediante la perspectiva de inversión de pruebas estadísticas. El artículo primero revisa el desarrollo histórico de intervalos de confianza basados en optimización en el contexto de un único funcional, desde "límites estrictos simultáneos" hasta la conjetura de Burrus y su refutación reciente mediante el marco de inversión de pruebas. Luego extiende este marco al caso de múltiples funcionales. El marco puede utilizarse para: (i) mejorar las constantes de calibración de métodos previos, produciendo regiones de confianza más pequeñas manteniendo cobertura frecuentista; (ii) obtener regiones de confianza multidimensionales tratables que no necesariamente sean hiperrrectangulares, capturando mejor la estructura de dependencia entre funcionales; (iii) generalizar desde distribuciones de error gaussiano a distribuciones de error log-cóncavas generales.

Antecedentes y Motivación de la Investigación

Definición del Problema

Este artículo estudia el problema de construcción de regiones de confianza simultáneas para múltiples funcionales en problemas inversos lineales. Se considera el problema inverso lineal: y=Kx+εy = Kx^* + \varepsilon donde yRny \in \mathbb{R}^n son las observaciones, xRpx^* \in \mathbb{R}^p es el parámetro desconocido, KRn×pK \in \mathbb{R}^{n \times p} es el operador directo conocido, y εRn\varepsilon \in \mathbb{R}^n es el ruido aleatorio.

Motivación de la Investigación

  1. Necesidad Científica: Muchos análisis científicos requieren inferir simultáneamente múltiples funcionales lineales HxHx^* de la señal desconocida, en lugar de estimar todo el parámetro de alta dimensión xx^*
  2. Información de Restricciones: El parámetro verdadero xx^* típicamente satisface restricciones basadas en conocimiento físico previo (como no negatividad x0x^* \geq 0)
  3. Cobertura Simultánea: Se requiere garantizar cobertura frecuentista simultánea para todos los funcionales, no solo cobertura marginal

Limitaciones de Métodos Existentes

  1. Conservadurismo: El método tradicional de límites estrictos simultáneos (SSB) es excesivamente conservador, construyendo primero un conjunto de confianza para xx^* y luego mapeándolo al espacio de funcionales
  2. Restricción Rectangular: Los métodos existentes típicamente producen regiones de confianza hiperrrectangulares, incapaces de capturar la estructura de dependencia entre funcionales
  3. Problemas de Calibración: Métodos históricos como la conjetura de Burrus carecen de garantías teóricas rigurosas

Contribuciones Principales

  1. Marco Unificado: Unifica métodos de construcción de regiones de confianza restringidas para un único funcional y múltiples funcionales mediante la perspectiva de inversión de pruebas
  2. Avances Teóricos:
    • Demuestra la convexidad de las funciones de cuantiles de los estadísticos de prueba λu2\lambda_u^2 y λ1\lambda^1
    • Determina la ubicación de la solución óptima en problemas de optimización de cuantiles
    • Establece relaciones de dominancia estocástica entre estadísticos de prueba
  3. Algoritmos Prácticos:
    • Proporciona constantes de calibración óptimas para problemas con restricción de no negatividad
    • Desarrolla el método de reducción TFM para problemas de alta dimensión
    • Propone técnicas de separación de espacio de filas/espacio nulo
  4. Mejora de Rendimiento: Reduce significativamente el volumen de regiones de confianza en comparación con métodos clásicos, manteniendo la tasa de cobertura nominal

Explicación Detallada del Método

Definición de la Tarea

Dada la matriz HRk×pH \in \mathbb{R}^{k \times p}, el objetivo es construir un conjunto de confianza frecuentista finito 1α1-\alpha Rα(y)RkR_\alpha(y) \subseteq \mathbb{R}^k para el vector desconocido HxRkHx^* \in \mathbb{R}^k, tal que: PyPx(HxRα(y))1αP_{y \sim P_x}(Hx \in R_\alpha(y)) \geq 1-\alpha se cumpla para todo xXx \in \mathcal{X} (conjunto de restricciones).

Marco de Inversión de Pruebas

Revisión del Caso de Funcional Único

Para cada μR\mu \in \mathbb{R}, se considera la prueba de hipótesis: H0:xΦμXvsH1:xXΦμH_0: x^* \in \Phi_\mu \cap \mathcal{X} \quad \text{vs} \quad H_1: x^* \in \mathcal{X} \setminus \Phi_\mu donde Φμ={xRp:hTx=μ}\Phi_\mu = \{x \in \mathbb{R}^p: h^T x = \mu\}.

Extensión a Múltiples Funcionales

Para μRk\mu \in \mathbb{R}^k, se define Φμ={xRp:Hx=μ}\Phi_\mu = \{x \in \mathbb{R}^p: Hx = \mu\}, y la prueba de hipótesis se convierte en: H0:xΦμXvsH1:xXΦμH_0: x^* \in \Phi_\mu \cap \mathcal{X} \quad \text{vs} \quad H_1: x^* \in \mathcal{X} \setminus \Phi_\mu

Tres Estadísticos de Prueba

El artículo analiza tres estadísticos de prueba:

  1. Término Restringido Cuadrado λc2(μ,y)\lambda_c^2(\mu, y): λc2(μ,y)=minHx=μ,AxbKxy22minAxbKxy22\lambda_c^2(\mu, y) = \min_{Hx=\mu, Ax \leq b} \|Kx - y\|_2^2 - \min_{Ax \leq b} \|Kx - y\|_2^2
  2. Término Sin Restricciones Cuadrado λu2(μ,y)\lambda_u^2(\mu, y): λu2(μ,y)=minHx=μ,AxbKxy22minxRpKxy22\lambda_u^2(\mu, y) = \min_{Hx=\mu, Ax \leq b} \|Kx - y\|_2^2 - \min_{x \in \mathbb{R}^p} \|Kx - y\|_2^2
  3. Término Único λ1(μ,y)\lambda^1(\mu, y): λ1(μ,y)=minHx=μ,AxbKxy22\lambda^1(\mu, y) = \min_{Hx=\mu, Ax \leq b} \|Kx - y\|_2^2

Problema de Calibración

Para cada estadístico de prueba, es necesario determinar umbrales para garantizar cobertura 1α1-\alpha:

  • Umbral Estratificado: d(μ)=supHx=μ,AxbQx,1αd^*(\mu) = \sup_{Hx=\mu, Ax \leq b} Q_{x,1-\alpha}
  • Umbral Global: D=supAxbQx,1αD^* = \sup_{Ax \leq b} Q_{x,1-\alpha}

donde Qx,1αQ_{x,1-\alpha} es el cuantil (1α)(1-\alpha) de Zx=λ(Hx,Kx+ε)Z_x = \lambda(Hx, Kx + \varepsilon).

Resultados Teóricos Clave

Teorema de Convexidad

Teorema 5.4: Para cualquier 0<α<10 < \alpha < 1 fijo, la función de cuantiles Qu2(x)Q_u^2(x) es convexa en xx.

Teorema de Maximización

Teorema 5.6 (Restricciones Lineales): Bajo restricciones lineales AxbAx^* \leq b, supxPQu2(x)=maxi=1:mQu2(pi)\sup_{x \in P} Q_u^2(x) = \max_{i=1:m} Q_u^2(p_i) donde {pi}i=1m\{p_i\}_{i=1}^m es el conjunto de puntos extremos del poliedro PP.

Teorema 5.7 (Restricciones Cónicas): Bajo restricciones cónicas xCx^* \in C, supxCQu2(x)=Qu2(0)\sup_{x \in C} Q_u^2(x) = Q_u^2(0)

Configuración Experimental

Ejemplos Numéricos

Se considera un problema con restricción de no negatividad: y=Kx+ε,εN(0,I),x0y = Kx + \varepsilon, \quad \varepsilon \sim N(0, I), \quad x^* \geq 0 donde: K=(211011),H=(110011)K = \begin{pmatrix} 2 & 1 & 1 \\ 0 & 1 & 1 \end{pmatrix}, \quad H = \begin{pmatrix} 1 & -1 & 0 \\ 0 & 1 & -1 \end{pmatrix}

Métodos de Comparación

  1. SSB_x: Caja delimitadora de descripción xx de límites estrictos simultáneos
  2. SSB_μ: Descripción μ\mu de límites estrictos simultáneos
  3. QuantileZero_x/μ: Versión mejorada usando constantes óptimas
  4. Bonferroni: Intervalos de producto con corrección de Bonferroni
  5. Método Split: Técnica de separación de espacio de filas/espacio nulo

Métricas de Evaluación

  • Tasa de Cobertura Empírica: Verificada mediante N=105N = 10^5 remuestreos
  • Área de Región: Calculada usando integración en coordenadas polares

Resultados Experimentales

Resultados Principales

Regiones de Confianza para Observaciones Fijas

Para y=(0,0)y = (0,0) e y=(20,10)y = (20,10), el método de descripción μ\mu produce conjuntos convexos estrictamente contenidos en las cajas delimitadoras de descripción xx, reduciendo significativamente el área de la región.

Distribución de Cobertura y Área

  • x=(0,0,0)x^* = (0,0,0): El método QuantileZero_μ logra una tasa de cobertura aproximadamente exacta del 68%, con área promedio mínima
  • x=(5,5,5)x^* = (5,5,5): Todos los métodos alcanzan cobertura, pero el método de descripción μ\mu mantiene ventajas significativas en área

Mejoras Cuantificadas

  1. Mejora de Constantes de Calibración: Para niveles de confianza del 68% y 95%, las constantes óptimas son 1.644 y 5.139 respectivamente, mostrando mejoras significativas sobre los valores 2.279 y 5.991 de la distribución χ22\chi^2_2
  2. Reducción de Área: La descripción μ\mu reduce el área promedio en comparación con la caja delimitadora de descripción xx en aproximadamente 30-50%

Trabajo Relacionado

Desarrollo Histórico

  1. Burrus (1964): Propone por primera vez métodos de optimización para intervalos de confianza restringidos
  2. Rust & O'Leary (1986): Desarrollan algoritmos prácticos
  3. Stark (1992): Propone el método de límites estrictos
  4. Tenorio et al. (2007): Desarrollan la técnica de reducción TFM

Avances Modernos

  • Batlle et al. (2023): Refutan la conjetura de Burrus mediante el marco de inversión de pruebas
  • Literatura de Inferencia Restringida: Conexiones con la teoría de distribuciones χ2\chi^2-bar
  • Predicción Conforme: Diferencias en objetivos e hipótesis

Conclusiones y Discusión

Conclusiones Principales

  1. Contribuciones Teóricas: Establece un marco unificado de inversión de pruebas para regiones de confianza de múltiples funcionales restringidos
  2. Ventajas Computacionales: Proporciona algoritmos escalables para problemas de alta dimensión
  3. Mejora de Rendimiento: Reduce significativamente el volumen de regiones de confianza en comparación con métodos clásicos

Limitaciones

  1. Estadístico λc2\lambda_c^2: La función de cuantiles carece de convexidad, el problema de maximización permanece abierto
  2. Complejidad Computacional: La búsqueda de puntos extremos en casos de alta dimensión puede ser difícil
  3. Umbrales Estratificados: Calcular la función completa d(μ)d^*(\mu) típicamente presenta desafíos

Direcciones Futuras

  1. Extensión No Gaussiana: Extender a distribuciones log-cóncavas generales
  2. Calibración de λc2\lambda_c^2: Desarrollar algoritmos de calibración para el estadístico de término restringido cuadrado
  3. Teoría Asintótica: Investigar propiedades de muestras grandes
  4. Campos de Aplicación: Extender a restricciones de forma y otros problemas estadísticos

Evaluación Profunda

Fortalezas

  1. Rigor Teórico: Proporciona un marco matemático completo, incluyendo pruebas de convexidad y resultados de optimalidad
  2. Valor Práctico: Desarrolla algoritmos escalables que resuelven problemas reales de alta dimensión
  3. Perspectiva Unificada: Unifica métodos históricamente dispersos bajo el marco de inversión de pruebas
  4. Mejoras Significativas: Reduce sustancialmente las regiones de confianza manteniendo garantías teóricas

Insuficiencias

  1. Vacíos Teóricos: La teoría completa del estadístico λc2\lambda_c^2 aún no se ha establecido
  2. Limitaciones Computacionales: Complejidad computacional en ciertos casos de alta dimensión
  3. Alcance Experimental: Los experimentos numéricos son relativamente simples, careciendo de aplicaciones reales complejas

Impacto

  1. Contribución Académica: Proporciona nuevas bases teóricas para la cuantificación de incertidumbre en problemas inversos restringidos
  2. Aplicaciones Prácticas: Perspectivas amplias de aplicación en ciencias físicas, ingeniería y otros campos que requieren inferencia restringida
  3. Significado Metodológico: El marco de inversión de pruebas puede inspirar soluciones a otros problemas estadísticos

Escenarios Aplicables

  • Inferencia simultánea de múltiples funcionales en problemas inversos lineales
  • Estimación de parámetros con restricciones físicas
  • Computación científica que requiere garantías frecuentistas rigurosas
  • Cuantificación de incertidumbre en problemas de optimización restringida de alta dimensión

Referencias

El artículo cita 47 referencias relacionadas, cubriendo trabajos importantes en múltiples campos incluyendo inferencia restringida, problemas inversos, teoría de optimización y estadística, proporcionando una base teórica sólida para la investigación.