2025-11-25T18:34:18.645261

Simultaneous Frequentist Calibration of Confidence Regions for Multiple Functionals in Constrained Inverse Problems

Batlle, Patil, Stanley et al.

Many scientific analyses require simultaneous comparison of multiple functionals of an unknown signal at once, calling for multidimensional confidence regions with guaranteed simultaneous frequentist under structural constraints (e.g., non-negativity, shape, or physics-based). This paper unifies and extends many previous optimization-based approaches to constrained confidence region construction in linear inverse problems through the lens of statistical test inversion. We begin by reviewing the historical development of optimization-based confidence intervals for the single-functional setting, from "strict bounds" to the Burrus conjecture and its recent refutation via the aforementioned test inversion framework. We then extend this framework to the multiple-functional setting. This framework can be used to: (i) improve the calibration constants of previous methods, yielding smaller confidence regions that still preserve frequentist coverage, (ii) obtain tractable multidimensional confidence regions that need not be hyper-rectangles to better capture functional dependence structure, and (iii) generalize beyond Gaussian error distributions to generic log-concave error distributions. We provide theory establishing nominal simultaneous coverage of our methods and show quantitative volume improvements relative to prior approaches using numerical experiments.

academic

Simultane Frequentistische Kalibrierung von Konfidenzregionen für mehrere Funktionale in beschränkten inversen Problemen

Grundinformationen

Paper-ID: 2510.11708
Titel: Simultane Frequentistische Kalibrierung von Konfidenzregionen für mehrere Funktionale in beschränkten inversen Problemen
Autoren: Pau Batlle, Pratik Patil, Michael Stanley, Javier Ruiz Lupon, Houman Owhadi, Mikael Kuusela
Klassifizierung: math.ST stat.TH
Veröffentlichungsdatum: 13. Oktober 2025
Paper-Link: https://arxiv.org/abs/2510.11708

Zusammenfassung

Viele wissenschaftliche Analysen erfordern den gleichzeitigen Vergleich mehrerer Funktionale eines unbekannten Signals, was die Konstruktion mehrdimensionaler Konfidenzregionen mit garantierter gleichzeitiger frequentistischer Überdeckung unter strukturellen Beschränkungen (wie Nichtnegativität, Form oder physikalisch begründete Beschränkungen) erfordert. Dieses Papier vereinheitlicht und erweitert optimierungsbasierte Methoden zur Konstruktion von Konfidenzregionen in beschränkten linearen inversen Problemen durch die Perspektive der statistischen Testinversion. Das Papier überprüft zunächst die historische Entwicklung optimierungsbasierter Konfidenzintervalle in der Einzel-Funktional-Einstellung, von „strikten Grenzen" bis zur Burrus-Vermutung und ihrer jüngsten Widerlegung durch das Testinversions-Framework. Anschließend wird das Framework auf die Mehrfunktional-Einstellung erweitert. Das Framework kann verwendet werden für: (i) Verbesserung der Kalibrierungskonstanten vorheriger Methoden, die kleinere, aber weiterhin frequentistisch überdeckte Konfidenzregionen erzeugen; (ii) Erhalt von handhabbaren mehrdimensionalen Konfidenzregionen, die nicht notwendigerweise hyperrechteckig sind, um die Abhängigkeitsstruktur zwischen Funktionalen besser zu erfassen; (iii) Verallgemeinerung von Gaußschen Fehlerverteilungen auf allgemeine log-konkave Fehlerverteilungen.

Forschungshintergrund und Motivation

Problemdefinition

Dieses Papier untersucht die Konstruktion gleichzeitiger Konfidenzregionen für mehrere Funktionale in linearen inversen Problemen. Betrachten Sie das lineare inverse Problem: $y = Kx^* + \varepsilon$ wobei $y \in \mathbb{R}^n$ die Beobachtungen, $x^* \in \mathbb{R}^p$ die unbekannten Parameter, $K \in \mathbb{R}^{n \times p}$ der bekannte Vorwärtsoperator und $\varepsilon \in \mathbb{R}^n$ das Zufallsrauschen ist.

Forschungsmotivation

Wissenschaftliche Anforderungen: Viele wissenschaftliche Analysen erfordern die gleichzeitige Inferenz mehrerer linearer Funktionale $Hx^*$ des unbekannten Signals, anstatt den gesamten hochdimensionalen Parameter $x^*$ zu schätzen
Beschränkungsinformation: Der wahre Parameter $x^*$ erfüllt typischerweise Beschränkungen, die auf vorherigem physikalischem Wissen basieren (wie Nichtnegativität $x^* \geq 0$ )
Gleichzeitige Überdeckung: Es ist erforderlich, die gleichzeitige frequentistische Überdeckung aller Funktionale zu garantieren, nicht nur die marginale Überdeckung

Einschränkungen bestehender Methoden

Konservativität: Die traditionelle Methode der gleichzeitigen strikten Grenzen (SSB) ist übermäßig konservativ und konstruiert zunächst einen Konfidenzbereich für $x^*$ , um ihn dann in den Funktionalraum abzubilden
Rechteck-Einschränkung: Bestehende Methoden erzeugen typischerweise hyperrechteckige Konfidenzregionen, die die Abhängigkeitsstruktur zwischen Funktionalen nicht erfassen können
Kalibrierungsprobleme: Historische Methoden wie die Burrus-Vermutung mangelt es an rigorosen theoretischen Garantien

Kernbeiträge

Einheitliches Framework: Vereinheitlicht Methoden zur Konstruktion von Einzel- und Mehrfunktional-Konfidenzregionen unter Beschränkungen durch die Perspektive der Testinversion
Theoretische Durchbrüche:
- Beweis der Konvexität der Quantilfunktionen der Teststatistiken $\lambda_u^2$ und $\lambda^1$
- Bestimmung der optimalen Lösungslage von Quantil-Optimierungsproblemen
- Etablierung von stochastischen Dominanzbeziehungen zwischen Teststatistiken
Praktische Algorithmen:
- Optimale Kalibrierungskonstanten für Nichtnegativitätsbeschränkungen
- Entwicklung der TFM-Reduktionsmethode für hochdimensionale Probleme
- Vorschlag von Zeilenraum-/Nullraum-Trennungstechniken
Leistungsverbesserung: Signifikante Reduktion des Konfidenzregionsvolumens im Vergleich zu klassischen Methoden bei Beibehaltung der nominalen Überdeckungsrate

Methodische Details

Aufgabendefinition

Gegeben eine Matrix $H \in \mathbb{R}^{k \times p}$ , besteht das Ziel darin, einen endlichen Stichproben- $1-\alpha$ frequentistischen Konfidenzbereich $R_\alpha(y) \subseteq \mathbb{R}^k$ für den unbekannten Vektor $Hx^* \in \mathbb{R}^k$ zu konstruieren, so dass: $P_{y \sim P_x}(Hx \in R_\alpha(y)) \geq 1-\alpha$ für alle $x \in \mathcal{X}$ (Beschränkungsmenge) gilt.

Testinversions-Framework

Überprüfung des Einzel-Funktional-Falls

Für jeden $\mu \in \mathbb{R}$ betrachten Sie den Hypothesentest: $H_0: x^* \in \Phi_\mu \cap \mathcal{X} \quad \text{vs} \quad H_1: x^* \in \mathcal{X} \setminus \Phi_\mu$ wobei $\Phi_\mu = \{x \in \mathbb{R}^p: h^T x = \mu\}$ .

Erweiterung auf mehrere Funktionale

Für $\mu \in \mathbb{R}^k$ definieren Sie $\Phi_\mu = \{x \in \mathbb{R}^p: Hx = \mu\}$ , und der Hypothesentest wird zu: $H_0: x^* \in \Phi_\mu \cap \mathcal{X} \quad \text{vs} \quad H_1: x^* \in \mathcal{X} \setminus \Phi_\mu$

Drei Teststatistiken

Das Papier analysiert drei Teststatistiken:

Beschränkter zweiter Term $\lambda_c^2(\mu, y)$ : $\lambda_c^2(\mu, y) = \min_{Hx=\mu, Ax \leq b} \|Kx - y\|_2^2 - \min_{Ax \leq b} \|Kx - y\|_2^2$
Unbeschränkter zweiter Term $\lambda_u^2(\mu, y)$ : $\lambda_u^2(\mu, y) = \min_{Hx=\mu, Ax \leq b} \|Kx - y\|_2^2 - \min_{x \in \mathbb{R}^p} \|Kx - y\|_2^2$
Einzelner Term $\lambda^1(\mu, y)$ : $\lambda^1(\mu, y) = \min_{Hx=\mu, Ax \leq b} \|Kx - y\|_2^2$

Kalibrierungsproblem

Für jede Teststatistik müssen Schwellenwerte bestimmt werden, um eine $1-\alpha$ Überdeckungsrate zu garantieren:

Schichtweise Schwellenwerte: $d^*(\mu) = \sup_{Hx=\mu, Ax \leq b} Q_{x,1-\alpha}$
Globale Schwellenwerte: $D^* = \sup_{Ax \leq b} Q_{x,1-\alpha}$

wobei $Q_{x,1-\alpha}$ das $(1-\alpha)$ -Quantil von $Z_x = \lambda(Hx, Kx + \varepsilon)$ ist.

Wichtige theoretische Ergebnisse

Konvexitätssatz

Satz 5.4: Für beliebige feste $0 < \alpha < 1$ ist die Quantilfunktion $Q_u^2(x)$ eine konvexe Funktion von $x$ .

Maximierungssatz

Satz 5.6 (Lineare Beschränkungen): Unter linearen Beschränkungen $Ax^* \leq b$ gilt: $\sup_{x \in P} Q_u^2(x) = \max_{i=1:m} Q_u^2(p_i)$ wobei $\{p_i\}_{i=1}^m$ die Menge der Extremalpunkte des Polyeders $P$ ist.

Satz 5.7 (Kegel-Beschränkungen): Unter Kegel-Beschränkungen $x^* \in C$ gilt: $\sup_{x \in C} Q_u^2(x) = Q_u^2(0)$

Experimentelle Einrichtung

Numerische Beispiele

Betrachten Sie das Nichtnegativitätsbeschränkungsproblem: $y = Kx + \varepsilon, \quad \varepsilon \sim N(0, I), \quad x^* \geq 0$ wobei: $K = \begin{pmatrix} 2 & 1 & 1 \\ 0 & 1 & 1 \end{pmatrix}, \quad H = \begin{pmatrix} 1 & -1 & 0 \\ 0 & 1 & -1 \end{pmatrix}$

Vergleichsmethoden

SSB_x: Begrenzungsrahmen der $x$ -Beschreibung der gleichzeitigen strikten Grenzen
SSB_μ: $\mu$ -Beschreibung der gleichzeitigen strikten Grenzen
QuantileZero_x/μ: Verbesserte Version mit optimalen Konstanten
Bonferroni: Bonferroni-Korrektur von Produktintervallen
Split-Methode: Zeilenraum-/Nullraum-Trennungstechnik

Bewertungsmetriken

Empirische Überdeckungsrate: Verifiziert durch $N = 10^5$ Resampling-Durchläufe
Regionsfläche: Berechnet mit Polarkoordinaten-Integration

Experimentelle Ergebnisse

Hauptergebnisse

Konfidenzregionen für feste Beobachtungswerte

Für $y = (0,0)$ und $y = (20,10)$ erzeugen $\mu$ -Beschreibungsmethoden konvexe Mengen, die streng in den $x$ -Beschreibungs-Begrenzungsrahmen eingebettet sind, was die Regionsfläche erheblich reduziert.

Überdeckungs- und Flächenverteilung

$x^* = (0,0,0)$ : Die QuantileZero_μ-Methode erreicht eine nahezu exakte 68%-Überdeckungsrate mit minimaler durchschnittlicher Fläche
$x^* = (5,5,5)$ : Alle Methoden zeigen Überdeckung, aber die $\mu$ -Beschreibungsmethode hat immer noch erhebliche Flächenvorteile

Quantifizierte Verbesserungen

Kalibrierungskonstanten-Verbesserung: Für 68%- und 95%-Konfidenzniveaus sind die optimalen Konstanten 1,644 bzw. 5,139, was eine signifikante Verbesserung gegenüber 2,279 und 5,991 der $\chi^2_2$ -Verteilung darstellt
Flächenreduktion: Die $\mu$ -Beschreibung reduziert die durchschnittliche Fläche um etwa 30-50% im Vergleich zum $x$ -Beschreibungs-Begrenzungsrahmen

Schlussfolgerungen und Diskussion

Hauptschlussfolgerungen

Theoretischer Beitrag: Etablierung eines einheitlichen Testinversions-Frameworks für Mehrfunktional-Konfidenzregionen unter Beschränkungen
Rechnerische Vorteile: Bereitstellung skalierbarer Algorithmen für hochdimensionale Probleme
Leistungsverbesserung: Signifikante Reduktion des Konfidenzregionsvolumens im Vergleich zu klassischen Methoden

Einschränkungen

$\lambda_c^2$ Statistik: Quantilfunktion mangelt es an Konvexität, Maximierungsproblem bleibt offen
Rechenkomplexität: Suche nach Extremalpunkten kann in hohen Dimensionen schwierig sein
Schichtweise Schwellenwerte: Berechnung der gesamten Funktion $d^*(\mu)$ ist typischerweise herausfordernd

Zukünftige Richtungen

Nicht-Gaußsche Erweiterung: Erweiterung auf allgemeine log-konkave Verteilungen
$\lambda_c^2$ Kalibrierung: Entwicklung von Kalibrierungsalgorithmen für die beschränkte zweite Term-Statistik
Asymptotische Theorie: Untersuchung von Großstichproben-Eigenschaften
Anwendungsfelder: Erweiterung auf Formbeschränkungen und andere statistische Probleme

Tiefgreifende Bewertung

Stärken

Theoretische Strenge: Bereitstellung eines vollständigen mathematischen Frameworks mit Konvexitätsbeweisen und Optimalitätsergebnissen
Praktischer Wert: Entwicklung skalierbarer Algorithmen zur Lösung hochdimensionaler praktischer Probleme
Einheitliche Perspektive: Vereinheitlichung historisch verstreuter Methoden unter dem Testinversions-Framework
Signifikante Verbesserung: Erhebliche Reduktion der Konfidenzregionen bei Beibehaltung theoretischer Garantien

Mängel

Theoretische Lücken: Vollständige Theorie für die $\lambda_c^2$ Statistik bleibt zu etablieren
Rechnerische Einschränkungen: Rechenkomplexität in bestimmten hochdimensionalen Fällen
Experimenteller Umfang: Relativ einfache numerische Experimente, Mangel an komplexen praktischen Anwendungen

Einfluss

Akademischer Beitrag: Bereitstellung neuer theoretischer Grundlagen für die Unsicherheitsquantifizierung in beschränkten inversen Problemen
Praktische Anwendung: Breite Anwendungsperspektiven in Naturwissenschaften, Ingenieurwesen und anderen Bereichen, die beschränkte Inferenz erfordern
Methodologische Bedeutung: Das Testinversions-Framework könnte die Lösung anderer statistischer Probleme inspirieren

Anwendungsszenarien

Mehrfunktional-Simultane Inferenz in linearen inversen Problemen
Parameterschätzung mit physikalischen Beschränkungen
Wissenschaftliche Berechnungen, die strenge frequentistische Garantien erfordern
Unsicherheitsquantifizierung in hochdimensionalen beschränkten Optimierungsproblemen

Literaturverzeichnis

Das Papier zitiert 47 relevante Referenzen, die wichtige Arbeiten aus mehreren Bereichen wie beschränkte Inferenz, inverse Probleme, Optimierungstheorie und Statistik abdecken und eine solide theoretische Grundlage für die Forschung bieten.