Many scientific analyses require simultaneous comparison of multiple functionals of an unknown signal at once, calling for multidimensional confidence regions with guaranteed simultaneous frequentist under structural constraints (e.g., non-negativity, shape, or physics-based). This paper unifies and extends many previous optimization-based approaches to constrained confidence region construction in linear inverse problems through the lens of statistical test inversion. We begin by reviewing the historical development of optimization-based confidence intervals for the single-functional setting, from "strict bounds" to the Burrus conjecture and its recent refutation via the aforementioned test inversion framework. We then extend this framework to the multiple-functional setting. This framework can be used to: (i) improve the calibration constants of previous methods, yielding smaller confidence regions that still preserve frequentist coverage, (ii) obtain tractable multidimensional confidence regions that need not be hyper-rectangles to better capture functional dependence structure, and (iii) generalize beyond Gaussian error distributions to generic log-concave error distributions. We provide theory establishing nominal simultaneous coverage of our methods and show quantitative volume improvements relative to prior approaches using numerical experiments.
- ID de l'article: 2510.11708
- Titre: Simultaneous Frequentist Calibration of Confidence Regions for Multiple Functionals in Constrained Inverse Problems
- Auteurs: Pau Batlle, Pratik Patil, Michael Stanley, Javier Ruiz Lupon, Houman Owhadi, Mikael Kuusela
- Classification: math.ST stat.TH
- Date de publication: 13 octobre 2025
- Lien de l'article: https://arxiv.org/abs/2510.11708
De nombreuses analyses scientifiques nécessitent de comparer simultanément plusieurs fonctionnelles d'un signal inconnu, ce qui exige la construction de régions de confiance multidimensionnelles avec des garanties de couverture fréquentiste simultanée sous des contraintes structurelles (telles que la non-négativité, les contraintes de forme ou les contraintes basées sur la physique). Cet article unifie et étend les méthodes de construction de régions de confiance basées sur l'optimisation dans les problèmes inverses linéaires contraints par le biais d'une perspective d'inversion de test statistique. L'article examine d'abord le développement historique des intervalles de confiance basés sur l'optimisation dans le cadre d'une seule fonctionnelle, des « bornes strictes » à la conjecture de Burrus et sa réfutation récente via le cadre d'inversion de test. Le cadre est ensuite étendu au cas de plusieurs fonctionnelles. Ce cadre peut être utilisé pour: (i) améliorer les constantes de calibrage des méthodes antérieures, produisant des régions de confiance plus petites tout en maintenant la couverture fréquentiste; (ii) obtenir des régions de confiance multidimensionnelles traitables qui ne sont pas nécessairement des hyper-rectangles, capturant mieux la structure de dépendance entre les fonctionnelles; (iii) généraliser au-delà des distributions d'erreur gaussiennes vers des distributions d'erreur log-concaves générales.
Cet article étudie la construction de régions de confiance simultanées pour plusieurs fonctionnelles dans les problèmes inverses linéaires. Considérons le problème inverse linéaire:
y=Kx∗+ε
où y∈Rn sont les observations, x∗∈Rp est le paramètre inconnu, K∈Rn×p est l'opérateur direct connu, et ε∈Rn est le bruit aléatoire.
- Besoins scientifiques: De nombreuses analyses scientifiques nécessitent l'inférence simultanée de plusieurs fonctionnelles linéaires Hx∗ du signal inconnu, plutôt que l'estimation du paramètre entier de haute dimension x∗
- Information de contrainte: Le paramètre réel x∗ satisfait généralement des contraintes basées sur les connaissances physiques préalables (telles que la non-négativité x∗≥0)
- Couverture simultanée: Il est nécessaire de garantir la couverture fréquentiste simultanée pour toutes les fonctionnelles, et non seulement la couverture marginale
- Conservatisme: Les méthodes traditionnelles de bornes strictes simultanées (SSB) sont trop conservatrices, construisant d'abord un ensemble de confiance pour x∗, puis le mappant dans l'espace des fonctionnelles
- Restriction rectangulaire: Les méthodes existantes produisent généralement des régions de confiance hyper-rectangulaires, incapables de capturer la structure de dépendance entre les fonctionnelles
- Problèmes de calibrage: Les méthodes historiques telles que la conjecture de Burrus manquent de garanties théoriques rigoureuses
- Cadre unifié: Unifie les méthodes de construction de régions de confiance contraintes pour une seule fonctionnelle et plusieurs fonctionnelles par le biais d'une perspective d'inversion de test
- Percées théoriques:
- Prouve la convexité des fonctions de quantile inverse pour les statistiques de test λu2 et λ1
- Détermine l'emplacement de la solution optimale des problèmes d'optimisation de quantile inverse
- Établit les relations de dominance stochastique entre les statistiques de test
- Algorithmes pratiques:
- Fournit les constantes de calibrage optimales pour les problèmes de contrainte de non-négativité
- Développe la méthode de réduction TFM pour les problèmes de haute dimension
- Propose des techniques de séparation espace des lignes/espace nul
- Amélioration des performances: Réduit significativement le volume des régions de confiance par rapport aux méthodes classiques, tout en maintenant le taux de couverture nominal
Étant donné la matrice H∈Rk×p, l'objectif est de construire un ensemble de confiance fréquentiste 1−α à échantillon fini Rα(y)⊆Rk pour le vecteur inconnu Hx∗∈Rk, tel que:
Py∼Px(Hx∈Rα(y))≥1−α
pour tous x∈X (l'ensemble de contrainte).
Pour chaque μ∈R, considérons le test d'hypothèse:
H0:x∗∈Φμ∩XvsH1:x∗∈X∖Φμ
où Φμ={x∈Rp:hTx=μ}.
Pour μ∈Rk, définissons Φμ={x∈Rp:Hx=μ}, le test d'hypothèse devient:
H0:x∗∈Φμ∩XvsH1:x∗∈X∖Φμ
L'article analyse trois statistiques de test:
- Terme au carré contraint λc2(μ,y):
λc2(μ,y)=minHx=μ,Ax≤b∥Kx−y∥22−minAx≤b∥Kx−y∥22
- Terme au carré non contraint λu2(μ,y):
λu2(μ,y)=minHx=μ,Ax≤b∥Kx−y∥22−minx∈Rp∥Kx−y∥22
- Terme unique λ1(μ,y):
λ1(μ,y)=minHx=μ,Ax≤b∥Kx−y∥22
Pour chaque statistique de test, il est nécessaire de déterminer un seuil pour garantir un taux de couverture 1−α:
- Seuil par tranche: d∗(μ)=supHx=μ,Ax≤bQx,1−α
- Seuil global: D∗=supAx≤bQx,1−α
où Qx,1−α est le quantile (1−α) de Zx=λ(Hx,Kx+ε).
Théorème 5.4: Pour tout 0<α<1 fixé, la fonction de quantile inverse Qu2(x) est une fonction convexe de x.
Théorème 5.6 (Contraintes linéaires): Sous les contraintes linéaires Ax∗≤b,
supx∈PQu2(x)=maxi=1:mQu2(pi)
où {pi}i=1m est l'ensemble des points extrêmes du polyèdre P.
Théorème 5.7 (Contraintes coniques): Sous les contraintes coniques x∗∈C,
supx∈CQu2(x)=Qu2(0)
Considérons un problème de contrainte de non-négativité:
y=Kx+ε,ε∼N(0,I),x∗≥0
où:
K=(201111),H=(10−110−1)
- SSB_x: Boîte englobante de description x des bornes strictes simultanées
- SSB_μ: Description μ des bornes strictes simultanées
- QuantileZero_x/μ: Version améliorée utilisant les constantes optimales
- Bonferroni: Intervalles de produit avec correction de Bonferroni
- Méthode Split: Technique de séparation espace des lignes/espace nul
- Taux de couverture empirique: Vérifié par N=105 rééchantillonnages
- Aire de la région: Calculée par intégration en coordonnées polaires
Pour y=(0,0) et y=(20,10), la méthode de description μ produit des ensembles convexes strictement contenus dans les boîtes englobantes de description x, réduisant significativement l'aire de la région.
- x∗=(0,0,0): La méthode QuantileZero_μ atteint un taux de couverture approximativement exact de 68%, avec l'aire moyenne minimale
- x∗=(5,5,5): Toutes les méthodes présentent une couverture, mais la méthode de description μ conserve toujours un avantage significatif en termes d'aire
- Amélioration des constantes de calibrage: Pour les niveaux de confiance de 68% et 95%, les constantes optimales sont respectivement 1,644 et 5,139, représentant une amélioration significative par rapport aux 2,279 et 5,991 de la distribution χ22
- Réduction d'aire: La description μ réduit l'aire moyenne d'environ 30-50% par rapport aux boîtes englobantes de description x
- Burrus (1964): Premier à proposer une méthode d'optimisation pour les intervalles de confiance contraints
- Rust & O'Leary (1986): Développement d'algorithmes pratiques
- Stark (1992): Proposition de la méthode des bornes strictes
- Tenorio et al. (2007): Développement de la technique de réduction TFM
- Batlle et al. (2023): Réfutation de la conjecture de Burrus via le cadre d'inversion de test
- Littérature sur l'inférence contrainte: Connexions avec la théorie de la distribution χ2-bar
- Prédiction conforme: Différences dans les objectifs et hypothèses
- Contributions théoriques: Établit un cadre unifié d'inversion de test pour les régions de confiance contraintes multi-fonctionnelles
- Avantages computationnels: Fournit des algorithmes évolutifs pour les problèmes de haute dimension
- Amélioration des performances: Réduit significativement le volume des régions de confiance par rapport aux méthodes classiques
- Statistique λc2: La fonction de quantile inverse manque de convexité, le problème de maximisation reste ouvert
- Complexité computationnelle: La recherche de points extrêmes en haute dimension peut être difficile
- Seuils par tranche: Le calcul de la fonction entière d∗(μ) présente généralement des défis
- Extension non-gaussienne: Extension aux distributions log-concaves générales
- Calibrage de λc2: Développement d'algorithmes de calibrage pour la statistique de terme au carré contraint
- Théorie asymptotique: Étude des propriétés à grand échantillon
- Domaines d'application: Extension aux contraintes de forme et autres problèmes statistiques
- Rigueur théorique: Fournit un cadre mathématique complet, incluant les preuves de convexité et les résultats d'optimalité
- Valeur pratique: Développe des algorithmes évolutifs résolvant les problèmes réels de haute dimension
- Perspective unifiée: Unifie les méthodes historiquement dispersées sous le cadre d'inversion de test
- Améliorations significatives: Réduit considérablement les régions de confiance tout en maintenant les garanties théoriques
- Lacunes théoriques: La théorie complète de la statistique λc2 reste à établir
- Limitations computationnelles: Complexité computationnelle dans certains cas de haute dimension
- Portée expérimentale: Les expériences numériques sont relativement simples, manquant d'applications réelles complexes
- Contribution académique: Fournit une nouvelle base théorique pour la quantification de l'incertitude dans les problèmes inverses contraints
- Applications pratiques: Perspectives d'application large dans les sciences physiques, l'ingénierie et d'autres domaines nécessitant l'inférence contrainte
- Signification méthodologique: Le cadre d'inversion de test peut inspirer la résolution d'autres problèmes statistiques
- Inférence simultanée multi-fonctionnelle dans les problèmes inverses linéaires
- Estimation de paramètres avec contraintes physiques
- Calcul scientifique nécessitant des garanties fréquentistes rigoureuses
- Quantification de l'incertitude dans les problèmes d'optimisation contrainte de haute dimension
L'article cite 47 références connexes, couvrant les travaux importants dans plusieurs domaines incluant l'inférence contrainte, les problèmes inverses, la théorie de l'optimisation et les statistiques, fournissant une base théorique solide pour la recherche.