2025-11-25T18:34:18.645261

Simultaneous Frequentist Calibration of Confidence Regions for Multiple Functionals in Constrained Inverse Problems

Batlle, Patil, Stanley et al.
Many scientific analyses require simultaneous comparison of multiple functionals of an unknown signal at once, calling for multidimensional confidence regions with guaranteed simultaneous frequentist under structural constraints (e.g., non-negativity, shape, or physics-based). This paper unifies and extends many previous optimization-based approaches to constrained confidence region construction in linear inverse problems through the lens of statistical test inversion. We begin by reviewing the historical development of optimization-based confidence intervals for the single-functional setting, from "strict bounds" to the Burrus conjecture and its recent refutation via the aforementioned test inversion framework. We then extend this framework to the multiple-functional setting. This framework can be used to: (i) improve the calibration constants of previous methods, yielding smaller confidence regions that still preserve frequentist coverage, (ii) obtain tractable multidimensional confidence regions that need not be hyper-rectangles to better capture functional dependence structure, and (iii) generalize beyond Gaussian error distributions to generic log-concave error distributions. We provide theory establishing nominal simultaneous coverage of our methods and show quantitative volume improvements relative to prior approaches using numerical experiments.
academic

Calibration Fréquentiste Simultanée de Régions de Confiance pour Plusieurs Fonctionnelles dans les Problèmes Inverses Contraints

Informations Fondamentales

  • ID de l'article: 2510.11708
  • Titre: Simultaneous Frequentist Calibration of Confidence Regions for Multiple Functionals in Constrained Inverse Problems
  • Auteurs: Pau Batlle, Pratik Patil, Michael Stanley, Javier Ruiz Lupon, Houman Owhadi, Mikael Kuusela
  • Classification: math.ST stat.TH
  • Date de publication: 13 octobre 2025
  • Lien de l'article: https://arxiv.org/abs/2510.11708

Résumé

De nombreuses analyses scientifiques nécessitent de comparer simultanément plusieurs fonctionnelles d'un signal inconnu, ce qui exige la construction de régions de confiance multidimensionnelles avec des garanties de couverture fréquentiste simultanée sous des contraintes structurelles (telles que la non-négativité, les contraintes de forme ou les contraintes basées sur la physique). Cet article unifie et étend les méthodes de construction de régions de confiance basées sur l'optimisation dans les problèmes inverses linéaires contraints par le biais d'une perspective d'inversion de test statistique. L'article examine d'abord le développement historique des intervalles de confiance basés sur l'optimisation dans le cadre d'une seule fonctionnelle, des « bornes strictes » à la conjecture de Burrus et sa réfutation récente via le cadre d'inversion de test. Le cadre est ensuite étendu au cas de plusieurs fonctionnelles. Ce cadre peut être utilisé pour: (i) améliorer les constantes de calibrage des méthodes antérieures, produisant des régions de confiance plus petites tout en maintenant la couverture fréquentiste; (ii) obtenir des régions de confiance multidimensionnelles traitables qui ne sont pas nécessairement des hyper-rectangles, capturant mieux la structure de dépendance entre les fonctionnelles; (iii) généraliser au-delà des distributions d'erreur gaussiennes vers des distributions d'erreur log-concaves générales.

Contexte et Motivation de la Recherche

Définition du Problème

Cet article étudie la construction de régions de confiance simultanées pour plusieurs fonctionnelles dans les problèmes inverses linéaires. Considérons le problème inverse linéaire: y=Kx+εy = Kx^* + \varepsilonyRny \in \mathbb{R}^n sont les observations, xRpx^* \in \mathbb{R}^p est le paramètre inconnu, KRn×pK \in \mathbb{R}^{n \times p} est l'opérateur direct connu, et εRn\varepsilon \in \mathbb{R}^n est le bruit aléatoire.

Motivation de la Recherche

  1. Besoins scientifiques: De nombreuses analyses scientifiques nécessitent l'inférence simultanée de plusieurs fonctionnelles linéaires HxHx^* du signal inconnu, plutôt que l'estimation du paramètre entier de haute dimension xx^*
  2. Information de contrainte: Le paramètre réel xx^* satisfait généralement des contraintes basées sur les connaissances physiques préalables (telles que la non-négativité x0x^* \geq 0)
  3. Couverture simultanée: Il est nécessaire de garantir la couverture fréquentiste simultanée pour toutes les fonctionnelles, et non seulement la couverture marginale

Limitations des Méthodes Existantes

  1. Conservatisme: Les méthodes traditionnelles de bornes strictes simultanées (SSB) sont trop conservatrices, construisant d'abord un ensemble de confiance pour xx^*, puis le mappant dans l'espace des fonctionnelles
  2. Restriction rectangulaire: Les méthodes existantes produisent généralement des régions de confiance hyper-rectangulaires, incapables de capturer la structure de dépendance entre les fonctionnelles
  3. Problèmes de calibrage: Les méthodes historiques telles que la conjecture de Burrus manquent de garanties théoriques rigoureuses

Contributions Principales

  1. Cadre unifié: Unifie les méthodes de construction de régions de confiance contraintes pour une seule fonctionnelle et plusieurs fonctionnelles par le biais d'une perspective d'inversion de test
  2. Percées théoriques:
    • Prouve la convexité des fonctions de quantile inverse pour les statistiques de test λu2\lambda_u^2 et λ1\lambda^1
    • Détermine l'emplacement de la solution optimale des problèmes d'optimisation de quantile inverse
    • Établit les relations de dominance stochastique entre les statistiques de test
  3. Algorithmes pratiques:
    • Fournit les constantes de calibrage optimales pour les problèmes de contrainte de non-négativité
    • Développe la méthode de réduction TFM pour les problèmes de haute dimension
    • Propose des techniques de séparation espace des lignes/espace nul
  4. Amélioration des performances: Réduit significativement le volume des régions de confiance par rapport aux méthodes classiques, tout en maintenant le taux de couverture nominal

Détails de la Méthode

Définition de la Tâche

Étant donné la matrice HRk×pH \in \mathbb{R}^{k \times p}, l'objectif est de construire un ensemble de confiance fréquentiste 1α1-\alpha à échantillon fini Rα(y)RkR_\alpha(y) \subseteq \mathbb{R}^k pour le vecteur inconnu HxRkHx^* \in \mathbb{R}^k, tel que: PyPx(HxRα(y))1αP_{y \sim P_x}(Hx \in R_\alpha(y)) \geq 1-\alpha pour tous xXx \in \mathcal{X} (l'ensemble de contrainte).

Cadre d'Inversion de Test

Examen du Cas d'une Seule Fonctionnelle

Pour chaque μR\mu \in \mathbb{R}, considérons le test d'hypothèse: H0:xΦμXvsH1:xXΦμH_0: x^* \in \Phi_\mu \cap \mathcal{X} \quad \text{vs} \quad H_1: x^* \in \mathcal{X} \setminus \Phi_\muΦμ={xRp:hTx=μ}\Phi_\mu = \{x \in \mathbb{R}^p: h^T x = \mu\}.

Extension à Plusieurs Fonctionnelles

Pour μRk\mu \in \mathbb{R}^k, définissons Φμ={xRp:Hx=μ}\Phi_\mu = \{x \in \mathbb{R}^p: Hx = \mu\}, le test d'hypothèse devient: H0:xΦμXvsH1:xXΦμH_0: x^* \in \Phi_\mu \cap \mathcal{X} \quad \text{vs} \quad H_1: x^* \in \mathcal{X} \setminus \Phi_\mu

Trois Statistiques de Test

L'article analyse trois statistiques de test:

  1. Terme au carré contraint λc2(μ,y)\lambda_c^2(\mu, y): λc2(μ,y)=minHx=μ,AxbKxy22minAxbKxy22\lambda_c^2(\mu, y) = \min_{Hx=\mu, Ax \leq b} \|Kx - y\|_2^2 - \min_{Ax \leq b} \|Kx - y\|_2^2
  2. Terme au carré non contraint λu2(μ,y)\lambda_u^2(\mu, y): λu2(μ,y)=minHx=μ,AxbKxy22minxRpKxy22\lambda_u^2(\mu, y) = \min_{Hx=\mu, Ax \leq b} \|Kx - y\|_2^2 - \min_{x \in \mathbb{R}^p} \|Kx - y\|_2^2
  3. Terme unique λ1(μ,y)\lambda^1(\mu, y): λ1(μ,y)=minHx=μ,AxbKxy22\lambda^1(\mu, y) = \min_{Hx=\mu, Ax \leq b} \|Kx - y\|_2^2

Problème de Calibrage

Pour chaque statistique de test, il est nécessaire de déterminer un seuil pour garantir un taux de couverture 1α1-\alpha:

  • Seuil par tranche: d(μ)=supHx=μ,AxbQx,1αd^*(\mu) = \sup_{Hx=\mu, Ax \leq b} Q_{x,1-\alpha}
  • Seuil global: D=supAxbQx,1αD^* = \sup_{Ax \leq b} Q_{x,1-\alpha}

Qx,1αQ_{x,1-\alpha} est le quantile (1α)(1-\alpha) de Zx=λ(Hx,Kx+ε)Z_x = \lambda(Hx, Kx + \varepsilon).

Résultats Théoriques Clés

Théorème de Convexité

Théorème 5.4: Pour tout 0<α<10 < \alpha < 1 fixé, la fonction de quantile inverse Qu2(x)Q_u^2(x) est une fonction convexe de xx.

Théorème de Maximisation

Théorème 5.6 (Contraintes linéaires): Sous les contraintes linéaires AxbAx^* \leq b, supxPQu2(x)=maxi=1:mQu2(pi)\sup_{x \in P} Q_u^2(x) = \max_{i=1:m} Q_u^2(p_i){pi}i=1m\{p_i\}_{i=1}^m est l'ensemble des points extrêmes du polyèdre PP.

Théorème 5.7 (Contraintes coniques): Sous les contraintes coniques xCx^* \in C, supxCQu2(x)=Qu2(0)\sup_{x \in C} Q_u^2(x) = Q_u^2(0)

Configuration Expérimentale

Exemple Numérique

Considérons un problème de contrainte de non-négativité: y=Kx+ε,εN(0,I),x0y = Kx + \varepsilon, \quad \varepsilon \sim N(0, I), \quad x^* \geq 0 où: K=(211011),H=(110011)K = \begin{pmatrix} 2 & 1 & 1 \\ 0 & 1 & 1 \end{pmatrix}, \quad H = \begin{pmatrix} 1 & -1 & 0 \\ 0 & 1 & -1 \end{pmatrix}

Méthodes Comparées

  1. SSB_x: Boîte englobante de description xx des bornes strictes simultanées
  2. SSB_μ: Description μ\mu des bornes strictes simultanées
  3. QuantileZero_x/μ: Version améliorée utilisant les constantes optimales
  4. Bonferroni: Intervalles de produit avec correction de Bonferroni
  5. Méthode Split: Technique de séparation espace des lignes/espace nul

Indicateurs d'Évaluation

  • Taux de couverture empirique: Vérifié par N=105N = 10^5 rééchantillonnages
  • Aire de la région: Calculée par intégration en coordonnées polaires

Résultats Expérimentaux

Résultats Principaux

Régions de Confiance pour une Observation Fixe

Pour y=(0,0)y = (0,0) et y=(20,10)y = (20,10), la méthode de description μ\mu produit des ensembles convexes strictement contenus dans les boîtes englobantes de description xx, réduisant significativement l'aire de la région.

Distribution de la Couverture et de l'Aire

  • x=(0,0,0)x^* = (0,0,0): La méthode QuantileZero_μ atteint un taux de couverture approximativement exact de 68%, avec l'aire moyenne minimale
  • x=(5,5,5)x^* = (5,5,5): Toutes les méthodes présentent une couverture, mais la méthode de description μ\mu conserve toujours un avantage significatif en termes d'aire

Améliorations Quantifiées

  1. Amélioration des constantes de calibrage: Pour les niveaux de confiance de 68% et 95%, les constantes optimales sont respectivement 1,644 et 5,139, représentant une amélioration significative par rapport aux 2,279 et 5,991 de la distribution χ22\chi^2_2
  2. Réduction d'aire: La description μ\mu réduit l'aire moyenne d'environ 30-50% par rapport aux boîtes englobantes de description xx

Travaux Connexes

Développement Historique

  1. Burrus (1964): Premier à proposer une méthode d'optimisation pour les intervalles de confiance contraints
  2. Rust & O'Leary (1986): Développement d'algorithmes pratiques
  3. Stark (1992): Proposition de la méthode des bornes strictes
  4. Tenorio et al. (2007): Développement de la technique de réduction TFM

Progrès Modernes

  • Batlle et al. (2023): Réfutation de la conjecture de Burrus via le cadre d'inversion de test
  • Littérature sur l'inférence contrainte: Connexions avec la théorie de la distribution χ2\chi^2-bar
  • Prédiction conforme: Différences dans les objectifs et hypothèses

Conclusions et Discussion

Conclusions Principales

  1. Contributions théoriques: Établit un cadre unifié d'inversion de test pour les régions de confiance contraintes multi-fonctionnelles
  2. Avantages computationnels: Fournit des algorithmes évolutifs pour les problèmes de haute dimension
  3. Amélioration des performances: Réduit significativement le volume des régions de confiance par rapport aux méthodes classiques

Limitations

  1. Statistique λc2\lambda_c^2: La fonction de quantile inverse manque de convexité, le problème de maximisation reste ouvert
  2. Complexité computationnelle: La recherche de points extrêmes en haute dimension peut être difficile
  3. Seuils par tranche: Le calcul de la fonction entière d(μ)d^*(\mu) présente généralement des défis

Directions Futures

  1. Extension non-gaussienne: Extension aux distributions log-concaves générales
  2. Calibrage de λc2\lambda_c^2: Développement d'algorithmes de calibrage pour la statistique de terme au carré contraint
  3. Théorie asymptotique: Étude des propriétés à grand échantillon
  4. Domaines d'application: Extension aux contraintes de forme et autres problèmes statistiques

Évaluation Approfondie

Points Forts

  1. Rigueur théorique: Fournit un cadre mathématique complet, incluant les preuves de convexité et les résultats d'optimalité
  2. Valeur pratique: Développe des algorithmes évolutifs résolvant les problèmes réels de haute dimension
  3. Perspective unifiée: Unifie les méthodes historiquement dispersées sous le cadre d'inversion de test
  4. Améliorations significatives: Réduit considérablement les régions de confiance tout en maintenant les garanties théoriques

Insuffisances

  1. Lacunes théoriques: La théorie complète de la statistique λc2\lambda_c^2 reste à établir
  2. Limitations computationnelles: Complexité computationnelle dans certains cas de haute dimension
  3. Portée expérimentale: Les expériences numériques sont relativement simples, manquant d'applications réelles complexes

Impact

  1. Contribution académique: Fournit une nouvelle base théorique pour la quantification de l'incertitude dans les problèmes inverses contraints
  2. Applications pratiques: Perspectives d'application large dans les sciences physiques, l'ingénierie et d'autres domaines nécessitant l'inférence contrainte
  3. Signification méthodologique: Le cadre d'inversion de test peut inspirer la résolution d'autres problèmes statistiques

Scénarios Applicables

  • Inférence simultanée multi-fonctionnelle dans les problèmes inverses linéaires
  • Estimation de paramètres avec contraintes physiques
  • Calcul scientifique nécessitant des garanties fréquentistes rigoureuses
  • Quantification de l'incertitude dans les problèmes d'optimisation contrainte de haute dimension

Références

L'article cite 47 références connexes, couvrant les travaux importants dans plusieurs domaines incluant l'inférence contrainte, les problèmes inverses, la théorie de l'optimisation et les statistiques, fournissant une base théorique solide pour la recherche.