2025-11-25T18:34:18.645261

Simultaneous Frequentist Calibration of Confidence Regions for Multiple Functionals in Constrained Inverse Problems

Batlle, Patil, Stanley et al.

Many scientific analyses require simultaneous comparison of multiple functionals of an unknown signal at once, calling for multidimensional confidence regions with guaranteed simultaneous frequentist under structural constraints (e.g., non-negativity, shape, or physics-based). This paper unifies and extends many previous optimization-based approaches to constrained confidence region construction in linear inverse problems through the lens of statistical test inversion. We begin by reviewing the historical development of optimization-based confidence intervals for the single-functional setting, from "strict bounds" to the Burrus conjecture and its recent refutation via the aforementioned test inversion framework. We then extend this framework to the multiple-functional setting. This framework can be used to: (i) improve the calibration constants of previous methods, yielding smaller confidence regions that still preserve frequentist coverage, (ii) obtain tractable multidimensional confidence regions that need not be hyper-rectangles to better capture functional dependence structure, and (iii) generalize beyond Gaussian error distributions to generic log-concave error distributions. We provide theory establishing nominal simultaneous coverage of our methods and show quantitative volume improvements relative to prior approaches using numerical experiments.

academic

Calibrazione Frequentista Simultanea di Regioni di Confidenza per Funzionali Multipli in Problemi Inversi Vincolati

Informazioni Fondamentali

ID Articolo: 2510.11708
Titolo: Simultaneous Frequentist Calibration of Confidence Regions for Multiple Functionals in Constrained Inverse Problems
Autori: Pau Batlle, Pratik Patil, Michael Stanley, Javier Ruiz Lupon, Houman Owhadi, Mikael Kuusela
Classificazione: math.ST stat.TH
Data di Pubblicazione: 13 ottobre 2025
Link Articolo: https://arxiv.org/abs/2510.11708

Riassunto

Molte analisi scientifiche richiedono il confronto simultaneo di molteplici funzionali di un segnale sconosciuto, il che necessita la costruzione di regioni di confidenza multidimensionali con copertura frequentista simultanea garantita sotto vincoli strutturali (quali non-negatività, vincoli di forma o vincoli basati su principi fisici). Questo articolo unifica e estende i metodi di costruzione di regioni di confidenza basati su ottimizzazione nei problemi inversi lineari vincolati attraverso la prospettiva dell'inversione di test statistici. L'articolo inizialmente esamina lo sviluppo storico degli intervalli di confidenza basati su ottimizzazione nel contesto di funzionali singoli, dai "limiti rigorosi simultanei" alla congettura di Burrus e alla sua recente confutazione attraverso il framework di inversione di test. Successivamente estende questo framework al contesto di funzionali multipli. Il framework può essere utilizzato per: (i) migliorare le costanti di calibrazione dei metodi precedenti, producendo regioni di confidenza più piccole mantenendo comunque la copertura frequentista; (ii) ottenere regioni di confidenza multidimensionali trattabili che non necessariamente sono iper-rettangolari, per catturare meglio la struttura di dipendenza tra funzionali; (iii) generalizzare da distribuzioni di errore gaussiane a distribuzioni di errore log-concave generali.

Contesto di Ricerca e Motivazione

Definizione del Problema

L'articolo affronta il problema della costruzione di regioni di confidenza simultanee per molteplici funzionali nei problemi inversi lineari. Si consideri il problema inverso lineare: $y = Kx^* + \varepsilon$ dove $y \in \mathbb{R}^n$ sono le osservazioni, $x^* \in \mathbb{R}^p$ è il parametro sconosciuto, $K \in \mathbb{R}^{n \times p}$ è l'operatore forward noto, e $\varepsilon \in \mathbb{R}^n$ è il rumore casuale.

Motivazione della Ricerca

Esigenze Scientifiche: Molte analisi scientifiche richiedono l'inferenza simultanea di molteplici funzionali lineari $Hx^*$ del segnale sconosciuto, piuttosto che la stima dell'intero parametro ad alta dimensione $x^*$
Informazioni Vincolate: Il parametro reale $x^*$ tipicamente soddisfa vincoli basati sulla conoscenza fisica a priori (quali non-negatività $x^* \geq 0$ )
Copertura Simultanea: È necessario garantire la copertura frequentista simultanea per tutti i funzionali, non solo la copertura marginale

Limitazioni dei Metodi Esistenti

Conservatività: I metodi tradizionali dei limiti rigorosi simultanei (SSB) sono eccessivamente conservativi, costruendo prima un insieme di confidenza per $x^*$ e poi mappandolo nello spazio dei funzionali
Restrizione Rettangolare: I metodi esistenti tipicamente producono regioni di confidenza iper-rettangolari, incapaci di catturare la struttura di dipendenza tra funzionali
Problemi di Calibrazione: Storicamente, metodi come la congettura di Burrus mancavano di garanzie teoriche rigorose

Contributi Principali

Framework Unificato: Unifica i metodi di costruzione di regioni di confidenza vincolate per funzionali singoli e multipli attraverso la prospettiva dell'inversione di test
Progressi Teorici:
- Dimostra la convessità delle funzioni dei quantili corrispondenti alle statistiche di test $\lambda_u^2$ e $\lambda^1$
- Determina la posizione della soluzione ottimale dei problemi di ottimizzazione dei quantili
- Stabilisce relazioni di dominanza stocastica tra statistiche di test
Algoritmi Pratici:
- Fornisce costanti di calibrazione ottimali per problemi con vincoli di non-negatività
- Sviluppa il metodo di riduzione TFM per problemi ad alta dimensione
- Propone tecniche di separazione spazio riga/spazio nullo
Miglioramenti di Prestazione: Riduce significativamente il volume delle regioni di confidenza rispetto ai metodi classici, mantenendo il tasso di copertura nominale

Dettagli Metodologici

Definizione del Compito

Data la matrice $H \in \mathbb{R}^{k \times p}$ , l'obiettivo è costruire un insieme di confidenza frequentista finito-campionario $1-\alpha$ $R_\alpha(y) \subseteq \mathbb{R}^k$ per il vettore sconosciuto $Hx^* \in \mathbb{R}^k$ , tale che: $P_{y \sim P_x}(Hx \in R_\alpha(y)) \geq 1-\alpha$ per tutti $x \in \mathcal{X}$ (insieme vincolato).

Framework di Inversione di Test

Revisione del Caso di Funzionale Singolo

Per ogni $\mu \in \mathbb{R}$ , si consideri il test di ipotesi: $H_0: x^* \in \Phi_\mu \cap \mathcal{X} \quad \text{vs} \quad H_1: x^* \in \mathcal{X} \setminus \Phi_\mu$ dove $\Phi_\mu = \{x \in \mathbb{R}^p: h^T x = \mu\}$ .

Estensione a Funzionali Multipli

Per $\mu \in \mathbb{R}^k$ , si definisca $\Phi_\mu = \{x \in \mathbb{R}^p: Hx = \mu\}$ , il test di ipotesi diventa: $H_0: x^* \in \Phi_\mu \cap \mathcal{X} \quad \text{vs} \quad H_1: x^* \in \mathcal{X} \setminus \Phi_\mu$

Tre Statistiche di Test

L'articolo analizza tre statistiche di test:

Termine Vincolato Secondo $\lambda_c^2(\mu, y)$ : $\lambda_c^2(\mu, y) = \min_{Hx=\mu, Ax \leq b} \|Kx - y\|_2^2 - \min_{Ax \leq b} \|Kx - y\|_2^2$
Termine Non-Vincolato Secondo $\lambda_u^2(\mu, y)$ : $\lambda_u^2(\mu, y) = \min_{Hx=\mu, Ax \leq b} \|Kx - y\|_2^2 - \min_{x \in \mathbb{R}^p} \|Kx - y\|_2^2$
Termine Singolo $\lambda^1(\mu, y)$ : $\lambda^1(\mu, y) = \min_{Hx=\mu, Ax \leq b} \|Kx - y\|_2^2$

Problema di Calibrazione

Per ogni statistica di test, è necessario determinare una soglia per garantire il tasso di copertura $1-\alpha$ :

Soglia Stratificata: $d^*(\mu) = \sup_{Hx=\mu, Ax \leq b} Q_{x,1-\alpha}$
Soglia Globale: $D^* = \sup_{Ax \leq b} Q_{x,1-\alpha}$

dove $Q_{x,1-\alpha}$ è il quantile $(1-\alpha)$ di $Z_x = \lambda(Hx, Kx + \varepsilon)$ .

Risultati Teorici Chiave

Teorema di Convessità

Teorema 5.4: Per ogni $0 < \alpha < 1$ fissato, la funzione dei quantili $Q_u^2(x)$ è convessa in $x$ .

Teorema di Massimizzazione

Teorema 5.6 (Vincoli Lineari): Sotto vincoli lineari $Ax^* \leq b$ , $\sup_{x \in P} Q_u^2(x) = \max_{i=1:m} Q_u^2(p_i)$ dove $\{p_i\}_{i=1}^m$ è l'insieme dei vertici del poliedro $P$ .

Teorema 5.7 (Vincoli Conici): Sotto vincoli conici $x^* \in C$ , $\sup_{x \in C} Q_u^2(x) = Q_u^2(0)$

Configurazione Sperimentale

Esempio Numerico

Si consideri il problema con vincolo di non-negatività: $y = Kx + \varepsilon, \quad \varepsilon \sim N(0, I), \quad x^* \geq 0$ dove: $K = \begin{pmatrix} 2 & 1 & 1 \\ 0 & 1 & 1 \end{pmatrix}, \quad H = \begin{pmatrix} 1 & -1 & 0 \\ 0 & 1 & -1 \end{pmatrix}$

Metodi di Confronto

SSB_x: Descrizione del limite della scatola di confine SSB nello spazio $x$
SSB_μ: Descrizione SSB nello spazio $\mu$
QuantileZero_x/μ: Versione migliorata utilizzando costanti ottimali
Bonferroni: Intervalli di prodotto con correzione di Bonferroni
Metodo Split: Tecnica di separazione spazio riga/spazio nullo

Metriche di Valutazione

Tasso di Copertura Empirico: Verificato attraverso $N = 10^5$ ricampionamenti
Area della Regione: Calcolata utilizzando integrazione in coordinate polari

Risultati Sperimentali

Risultati Principali

Regioni di Confidenza per Osservazioni Fisse

Per $y = (0,0)$ e $y = (20,10)$ , il metodo di descrizione $\mu$ produce insiemi convessi strettamente contenuti nei limiti della scatola di confine $x$ , riducendo significativamente l'area della regione.

Distribuzione di Copertura e Area

$x^* = (0,0,0)$ : Il metodo QuantileZero_μ raggiunge un tasso di copertura approssimativamente preciso del 68%, con area media minima
$x^* = (5,5,5)$ : Tutti i metodi raggiungono la copertura, ma il metodo di descrizione $\mu$ mantiene comunque vantaggi significativi in termini di area

Miglioramenti Quantificati

Miglioramento delle Costanti di Calibrazione: Per i livelli di confidenza del 68% e 95%, le costanti ottimali sono rispettivamente 1,644 e 5,139, con miglioramenti significativi rispetto ai valori 2,279 e 5,991 della distribuzione $\chi^2_2$
Riduzione dell'Area: La descrizione $\mu$ riduce l'area media di circa il 30-50% rispetto ai limiti della scatola di confine $x$

Lavori Correlati

Sviluppo Storico

Burrus (1964): Primo a proporre il metodo di ottimizzazione per intervalli di confidenza vincolati
Rust & O'Leary (1986): Sviluppo di algoritmi pratici
Stark (1992): Proposta del metodo dei limiti rigorosi
Tenorio et al. (2007): Sviluppo della tecnica di riduzione TFM

Progressi Moderni

Batlle et al. (2023): Confutazione della congettura di Burrus attraverso il framework di inversione di test
Letteratura sull'Inferenza Vincolata: Connessioni con la teoria della distribuzione $\chi^2$ -bar
Predizione Conforme: Distinzioni negli obiettivi e nelle ipotesi

Conclusioni e Discussione

Conclusioni Principali

Contributi Teorici: Stabilisce un framework unificato di inversione di test per regioni di confidenza vincolate con funzionali multipli
Vantaggi Computazionali: Fornisce algoritmi scalabili per problemi ad alta dimensione
Miglioramenti di Prestazione: Riduce significativamente il volume delle regioni di confidenza rispetto ai metodi classici

Limitazioni

Statistica $\lambda_c^2$ : La funzione dei quantili manca di convessità, il problema di massimizzazione rimane aperto
Complessità Computazionale: La ricerca dei vertici in casi ad alta dimensione potrebbe essere difficile
Soglia Stratificata: Il calcolo della funzione completa $d^*(\mu)$ è tipicamente impegnativo

Direzioni Future

Estensione Non-Gaussiana: Estensione a distribuzioni log-concave generali
Calibrazione di $\lambda_c^2$ : Sviluppo di algoritmi di calibrazione per la statistica del termine vincolato secondo
Teoria Asintotica: Studio delle proprietà in grandi campioni
Campi di Applicazione: Estensione a vincoli di forma e altri problemi statistici

Valutazione Approfondita

Punti di Forza

Rigore Teorico: Fornisce un framework matematico completo, incluse prove di convessità e risultati di ottimalità
Valore Pratico: Sviluppa algoritmi scalabili che risolvono problemi pratici ad alta dimensione
Prospettiva Unificata: Unifica metodi storicamente dispersi sotto il framework di inversione di test
Miglioramenti Significativi: Riduce sostanzialmente le regioni di confidenza mantenendo garanzie teoriche

Insufficienze

Lacune Teoriche: La teoria completa per la statistica $\lambda_c^2$ rimane ancora da stabilire
Limitazioni Computazionali: Complessità computazionale in alcuni casi ad alta dimensione
Portata Sperimentale: Gli esperimenti numerici sono relativamente semplici, mancano applicazioni pratiche complesse

Impatto

Contributi Accademici: Fornisce nuove basi teoriche per la quantificazione dell'incertezza nei problemi inversi vincolati
Applicazioni Pratiche: Prospettive di applicazione diffusa in scienze fisiche, ingegneria e altri campi che richiedono inferenza vincolata
Significato Metodologico: Il framework di inversione di test potrebbe ispirare soluzioni per altri problemi statistici

Scenari Applicabili

Inferenza simultanea di funzionali multipli nei problemi inversi lineari
Stima di parametri con vincoli fisici
Calcolo scientifico che richiede garanzie frequentiste rigorose
Quantificazione dell'incertezza in problemi di ottimizzazione vincolata ad alta dimensione

Bibliografia

L'articolo cita 47 riferimenti correlati, coprendo lavori importanti in inferenza vincolata, problemi inversi, teoria dell'ottimizzazione e statistica, fornendo una base teorica solida per la ricerca.