2025-11-25T18:34:18.645261

Simultaneous Frequentist Calibration of Confidence Regions for Multiple Functionals in Constrained Inverse Problems

Batlle, Patil, Stanley et al.

Many scientific analyses require simultaneous comparison of multiple functionals of an unknown signal at once, calling for multidimensional confidence regions with guaranteed simultaneous frequentist under structural constraints (e.g., non-negativity, shape, or physics-based). This paper unifies and extends many previous optimization-based approaches to constrained confidence region construction in linear inverse problems through the lens of statistical test inversion. We begin by reviewing the historical development of optimization-based confidence intervals for the single-functional setting, from "strict bounds" to the Burrus conjecture and its recent refutation via the aforementioned test inversion framework. We then extend this framework to the multiple-functional setting. This framework can be used to: (i) improve the calibration constants of previous methods, yielding smaller confidence regions that still preserve frequentist coverage, (ii) obtain tractable multidimensional confidence regions that need not be hyper-rectangles to better capture functional dependence structure, and (iii) generalize beyond Gaussian error distributions to generic log-concave error distributions. We provide theory establishing nominal simultaneous coverage of our methods and show quantitative volume improvements relative to prior approaches using numerical experiments.

academic

Calibration Fréquentiste Simultanée de Régions de Confiance pour Plusieurs Fonctionnelles dans les Problèmes Inverses Contraints

Informations Fondamentales

ID de l'article: 2510.11708
Titre: Simultaneous Frequentist Calibration of Confidence Regions for Multiple Functionals in Constrained Inverse Problems
Auteurs: Pau Batlle, Pratik Patil, Michael Stanley, Javier Ruiz Lupon, Houman Owhadi, Mikael Kuusela
Classification: math.ST stat.TH
Date de publication: 13 octobre 2025
Lien de l'article: https://arxiv.org/abs/2510.11708

Résumé

De nombreuses analyses scientifiques nécessitent de comparer simultanément plusieurs fonctionnelles d'un signal inconnu, ce qui exige la construction de régions de confiance multidimensionnelles avec des garanties de couverture fréquentiste simultanée sous des contraintes structurelles (telles que la non-négativité, les contraintes de forme ou les contraintes basées sur la physique). Cet article unifie et étend les méthodes de construction de régions de confiance basées sur l'optimisation dans les problèmes inverses linéaires contraints par le biais d'une perspective d'inversion de test statistique. L'article examine d'abord le développement historique des intervalles de confiance basés sur l'optimisation dans le cadre d'une seule fonctionnelle, des « bornes strictes » à la conjecture de Burrus et sa réfutation récente via le cadre d'inversion de test. Le cadre est ensuite étendu au cas de plusieurs fonctionnelles. Ce cadre peut être utilisé pour: (i) améliorer les constantes de calibrage des méthodes antérieures, produisant des régions de confiance plus petites tout en maintenant la couverture fréquentiste; (ii) obtenir des régions de confiance multidimensionnelles traitables qui ne sont pas nécessairement des hyper-rectangles, capturant mieux la structure de dépendance entre les fonctionnelles; (iii) généraliser au-delà des distributions d'erreur gaussiennes vers des distributions d'erreur log-concaves générales.

Contexte et Motivation de la Recherche

Définition du Problème

Cet article étudie la construction de régions de confiance simultanées pour plusieurs fonctionnelles dans les problèmes inverses linéaires. Considérons le problème inverse linéaire: $y = Kx^* + \varepsilon$ où $y \in \mathbb{R}^n$ sont les observations, $x^* \in \mathbb{R}^p$ est le paramètre inconnu, $K \in \mathbb{R}^{n \times p}$ est l'opérateur direct connu, et $\varepsilon \in \mathbb{R}^n$ est le bruit aléatoire.

Motivation de la Recherche

Besoins scientifiques: De nombreuses analyses scientifiques nécessitent l'inférence simultanée de plusieurs fonctionnelles linéaires $Hx^*$ du signal inconnu, plutôt que l'estimation du paramètre entier de haute dimension $x^*$
Information de contrainte: Le paramètre réel $x^*$ satisfait généralement des contraintes basées sur les connaissances physiques préalables (telles que la non-négativité $x^* \geq 0$ )
Couverture simultanée: Il est nécessaire de garantir la couverture fréquentiste simultanée pour toutes les fonctionnelles, et non seulement la couverture marginale

Limitations des Méthodes Existantes

Conservatisme: Les méthodes traditionnelles de bornes strictes simultanées (SSB) sont trop conservatrices, construisant d'abord un ensemble de confiance pour $x^*$ , puis le mappant dans l'espace des fonctionnelles
Restriction rectangulaire: Les méthodes existantes produisent généralement des régions de confiance hyper-rectangulaires, incapables de capturer la structure de dépendance entre les fonctionnelles
Problèmes de calibrage: Les méthodes historiques telles que la conjecture de Burrus manquent de garanties théoriques rigoureuses

Contributions Principales

Cadre unifié: Unifie les méthodes de construction de régions de confiance contraintes pour une seule fonctionnelle et plusieurs fonctionnelles par le biais d'une perspective d'inversion de test
Percées théoriques:
- Prouve la convexité des fonctions de quantile inverse pour les statistiques de test $\lambda_u^2$ et $\lambda^1$
- Détermine l'emplacement de la solution optimale des problèmes d'optimisation de quantile inverse
- Établit les relations de dominance stochastique entre les statistiques de test
Algorithmes pratiques:
- Fournit les constantes de calibrage optimales pour les problèmes de contrainte de non-négativité
- Développe la méthode de réduction TFM pour les problèmes de haute dimension
- Propose des techniques de séparation espace des lignes/espace nul
Amélioration des performances: Réduit significativement le volume des régions de confiance par rapport aux méthodes classiques, tout en maintenant le taux de couverture nominal

Détails de la Méthode

Définition de la Tâche

Étant donné la matrice $H \in \mathbb{R}^{k \times p}$ , l'objectif est de construire un ensemble de confiance fréquentiste $1-\alpha$ à échantillon fini $R_\alpha(y) \subseteq \mathbb{R}^k$ pour le vecteur inconnu $Hx^* \in \mathbb{R}^k$ , tel que: $P_{y \sim P_x}(Hx \in R_\alpha(y)) \geq 1-\alpha$ pour tous $x \in \mathcal{X}$ (l'ensemble de contrainte).

Cadre d'Inversion de Test

Examen du Cas d'une Seule Fonctionnelle

Pour chaque $\mu \in \mathbb{R}$ , considérons le test d'hypothèse: $H_0: x^* \in \Phi_\mu \cap \mathcal{X} \quad \text{vs} \quad H_1: x^* \in \mathcal{X} \setminus \Phi_\mu$ où $\Phi_\mu = \{x \in \mathbb{R}^p: h^T x = \mu\}$ .

Extension à Plusieurs Fonctionnelles

Pour $\mu \in \mathbb{R}^k$ , définissons $\Phi_\mu = \{x \in \mathbb{R}^p: Hx = \mu\}$ , le test d'hypothèse devient: $H_0: x^* \in \Phi_\mu \cap \mathcal{X} \quad \text{vs} \quad H_1: x^* \in \mathcal{X} \setminus \Phi_\mu$

Trois Statistiques de Test

L'article analyse trois statistiques de test:

Terme au carré contraint $\lambda_c^2(\mu, y)$ : $\lambda_c^2(\mu, y) = \min_{Hx=\mu, Ax \leq b} \|Kx - y\|_2^2 - \min_{Ax \leq b} \|Kx - y\|_2^2$
Terme au carré non contraint $\lambda_u^2(\mu, y)$ : $\lambda_u^2(\mu, y) = \min_{Hx=\mu, Ax \leq b} \|Kx - y\|_2^2 - \min_{x \in \mathbb{R}^p} \|Kx - y\|_2^2$
Terme unique $\lambda^1(\mu, y)$ : $\lambda^1(\mu, y) = \min_{Hx=\mu, Ax \leq b} \|Kx - y\|_2^2$

Problème de Calibrage

Pour chaque statistique de test, il est nécessaire de déterminer un seuil pour garantir un taux de couverture $1-\alpha$ :

Seuil par tranche: $d^*(\mu) = \sup_{Hx=\mu, Ax \leq b} Q_{x,1-\alpha}$
Seuil global: $D^* = \sup_{Ax \leq b} Q_{x,1-\alpha}$

où $Q_{x,1-\alpha}$ est le quantile $(1-\alpha)$ de $Z_x = \lambda(Hx, Kx + \varepsilon)$ .

Résultats Théoriques Clés

Théorème de Convexité

Théorème 5.4: Pour tout $0 < \alpha < 1$ fixé, la fonction de quantile inverse $Q_u^2(x)$ est une fonction convexe de $x$ .

Théorème de Maximisation

Théorème 5.6 (Contraintes linéaires): Sous les contraintes linéaires $Ax^* \leq b$ , $\sup_{x \in P} Q_u^2(x) = \max_{i=1:m} Q_u^2(p_i)$ où $\{p_i\}_{i=1}^m$ est l'ensemble des points extrêmes du polyèdre $P$ .

Théorème 5.7 (Contraintes coniques): Sous les contraintes coniques $x^* \in C$ , $\sup_{x \in C} Q_u^2(x) = Q_u^2(0)$

Configuration Expérimentale

Exemple Numérique

Considérons un problème de contrainte de non-négativité: $y = Kx + \varepsilon, \quad \varepsilon \sim N(0, I), \quad x^* \geq 0$ où: $K = \begin{pmatrix} 2 & 1 & 1 \\ 0 & 1 & 1 \end{pmatrix}, \quad H = \begin{pmatrix} 1 & -1 & 0 \\ 0 & 1 & -1 \end{pmatrix}$

Méthodes Comparées

SSB_x: Boîte englobante de description $x$ des bornes strictes simultanées
SSB_μ: Description $\mu$ des bornes strictes simultanées
QuantileZero_x/μ: Version améliorée utilisant les constantes optimales
Bonferroni: Intervalles de produit avec correction de Bonferroni
Méthode Split: Technique de séparation espace des lignes/espace nul

Indicateurs d'Évaluation

Taux de couverture empirique: Vérifié par $N = 10^5$ rééchantillonnages
Aire de la région: Calculée par intégration en coordonnées polaires

Résultats Expérimentaux

Résultats Principaux

Régions de Confiance pour une Observation Fixe

Pour $y = (0,0)$ et $y = (20,10)$ , la méthode de description $\mu$ produit des ensembles convexes strictement contenus dans les boîtes englobantes de description $x$ , réduisant significativement l'aire de la région.

Distribution de la Couverture et de l'Aire

$x^* = (0,0,0)$ : La méthode QuantileZero_μ atteint un taux de couverture approximativement exact de 68%, avec l'aire moyenne minimale
$x^* = (5,5,5)$ : Toutes les méthodes présentent une couverture, mais la méthode de description $\mu$ conserve toujours un avantage significatif en termes d'aire

Améliorations Quantifiées

Amélioration des constantes de calibrage: Pour les niveaux de confiance de 68% et 95%, les constantes optimales sont respectivement 1,644 et 5,139, représentant une amélioration significative par rapport aux 2,279 et 5,991 de la distribution $\chi^2_2$
Réduction d'aire: La description $\mu$ réduit l'aire moyenne d'environ 30-50% par rapport aux boîtes englobantes de description $x$

Travaux Connexes

Développement Historique

Burrus (1964): Premier à proposer une méthode d'optimisation pour les intervalles de confiance contraints
Rust & O'Leary (1986): Développement d'algorithmes pratiques
Stark (1992): Proposition de la méthode des bornes strictes
Tenorio et al. (2007): Développement de la technique de réduction TFM

Progrès Modernes

Batlle et al. (2023): Réfutation de la conjecture de Burrus via le cadre d'inversion de test
Littérature sur l'inférence contrainte: Connexions avec la théorie de la distribution $\chi^2$ -bar
Prédiction conforme: Différences dans les objectifs et hypothèses

Conclusions et Discussion

Conclusions Principales

Contributions théoriques: Établit un cadre unifié d'inversion de test pour les régions de confiance contraintes multi-fonctionnelles
Avantages computationnels: Fournit des algorithmes évolutifs pour les problèmes de haute dimension
Amélioration des performances: Réduit significativement le volume des régions de confiance par rapport aux méthodes classiques

Limitations

Statistique $\lambda_c^2$ : La fonction de quantile inverse manque de convexité, le problème de maximisation reste ouvert
Complexité computationnelle: La recherche de points extrêmes en haute dimension peut être difficile
Seuils par tranche: Le calcul de la fonction entière $d^*(\mu)$ présente généralement des défis

Directions Futures

Extension non-gaussienne: Extension aux distributions log-concaves générales
Calibrage de $\lambda_c^2$ : Développement d'algorithmes de calibrage pour la statistique de terme au carré contraint
Théorie asymptotique: Étude des propriétés à grand échantillon
Domaines d'application: Extension aux contraintes de forme et autres problèmes statistiques

Évaluation Approfondie

Points Forts

Rigueur théorique: Fournit un cadre mathématique complet, incluant les preuves de convexité et les résultats d'optimalité
Valeur pratique: Développe des algorithmes évolutifs résolvant les problèmes réels de haute dimension
Perspective unifiée: Unifie les méthodes historiquement dispersées sous le cadre d'inversion de test
Améliorations significatives: Réduit considérablement les régions de confiance tout en maintenant les garanties théoriques

Insuffisances

Lacunes théoriques: La théorie complète de la statistique $\lambda_c^2$ reste à établir
Limitations computationnelles: Complexité computationnelle dans certains cas de haute dimension
Portée expérimentale: Les expériences numériques sont relativement simples, manquant d'applications réelles complexes

Impact

Contribution académique: Fournit une nouvelle base théorique pour la quantification de l'incertitude dans les problèmes inverses contraints
Applications pratiques: Perspectives d'application large dans les sciences physiques, l'ingénierie et d'autres domaines nécessitant l'inférence contrainte
Signification méthodologique: Le cadre d'inversion de test peut inspirer la résolution d'autres problèmes statistiques

Scénarios Applicables

Inférence simultanée multi-fonctionnelle dans les problèmes inverses linéaires
Estimation de paramètres avec contraintes physiques
Calcul scientifique nécessitant des garanties fréquentistes rigoureuses
Quantification de l'incertitude dans les problèmes d'optimisation contrainte de haute dimension

Références

L'article cite 47 références connexes, couvrant les travaux importants dans plusieurs domaines incluant l'inférence contrainte, les problèmes inverses, la théorie de l'optimisation et les statistiques, fournissant une base théorique solide pour la recherche.