2025-11-25T18:34:18.645261

Simultaneous Frequentist Calibration of Confidence Regions for Multiple Functionals in Constrained Inverse Problems

Batlle, Patil, Stanley et al.
Many scientific analyses require simultaneous comparison of multiple functionals of an unknown signal at once, calling for multidimensional confidence regions with guaranteed simultaneous frequentist under structural constraints (e.g., non-negativity, shape, or physics-based). This paper unifies and extends many previous optimization-based approaches to constrained confidence region construction in linear inverse problems through the lens of statistical test inversion. We begin by reviewing the historical development of optimization-based confidence intervals for the single-functional setting, from "strict bounds" to the Burrus conjecture and its recent refutation via the aforementioned test inversion framework. We then extend this framework to the multiple-functional setting. This framework can be used to: (i) improve the calibration constants of previous methods, yielding smaller confidence regions that still preserve frequentist coverage, (ii) obtain tractable multidimensional confidence regions that need not be hyper-rectangles to better capture functional dependence structure, and (iii) generalize beyond Gaussian error distributions to generic log-concave error distributions. We provide theory establishing nominal simultaneous coverage of our methods and show quantitative volume improvements relative to prior approaches using numerical experiments.
academic

Simultane Frequentistische Kalibrierung von Konfidenzregionen für mehrere Funktionale in beschränkten inversen Problemen

Grundinformationen

  • Paper-ID: 2510.11708
  • Titel: Simultane Frequentistische Kalibrierung von Konfidenzregionen für mehrere Funktionale in beschränkten inversen Problemen
  • Autoren: Pau Batlle, Pratik Patil, Michael Stanley, Javier Ruiz Lupon, Houman Owhadi, Mikael Kuusela
  • Klassifizierung: math.ST stat.TH
  • Veröffentlichungsdatum: 13. Oktober 2025
  • Paper-Link: https://arxiv.org/abs/2510.11708

Zusammenfassung

Viele wissenschaftliche Analysen erfordern den gleichzeitigen Vergleich mehrerer Funktionale eines unbekannten Signals, was die Konstruktion mehrdimensionaler Konfidenzregionen mit garantierter gleichzeitiger frequentistischer Überdeckung unter strukturellen Beschränkungen (wie Nichtnegativität, Form oder physikalisch begründete Beschränkungen) erfordert. Dieses Papier vereinheitlicht und erweitert optimierungsbasierte Methoden zur Konstruktion von Konfidenzregionen in beschränkten linearen inversen Problemen durch die Perspektive der statistischen Testinversion. Das Papier überprüft zunächst die historische Entwicklung optimierungsbasierter Konfidenzintervalle in der Einzel-Funktional-Einstellung, von „strikten Grenzen" bis zur Burrus-Vermutung und ihrer jüngsten Widerlegung durch das Testinversions-Framework. Anschließend wird das Framework auf die Mehrfunktional-Einstellung erweitert. Das Framework kann verwendet werden für: (i) Verbesserung der Kalibrierungskonstanten vorheriger Methoden, die kleinere, aber weiterhin frequentistisch überdeckte Konfidenzregionen erzeugen; (ii) Erhalt von handhabbaren mehrdimensionalen Konfidenzregionen, die nicht notwendigerweise hyperrechteckig sind, um die Abhängigkeitsstruktur zwischen Funktionalen besser zu erfassen; (iii) Verallgemeinerung von Gaußschen Fehlerverteilungen auf allgemeine log-konkave Fehlerverteilungen.

Forschungshintergrund und Motivation

Problemdefinition

Dieses Papier untersucht die Konstruktion gleichzeitiger Konfidenzregionen für mehrere Funktionale in linearen inversen Problemen. Betrachten Sie das lineare inverse Problem: y=Kx+εy = Kx^* + \varepsilon wobei yRny \in \mathbb{R}^n die Beobachtungen, xRpx^* \in \mathbb{R}^p die unbekannten Parameter, KRn×pK \in \mathbb{R}^{n \times p} der bekannte Vorwärtsoperator und εRn\varepsilon \in \mathbb{R}^n das Zufallsrauschen ist.

Forschungsmotivation

  1. Wissenschaftliche Anforderungen: Viele wissenschaftliche Analysen erfordern die gleichzeitige Inferenz mehrerer linearer Funktionale HxHx^* des unbekannten Signals, anstatt den gesamten hochdimensionalen Parameter xx^* zu schätzen
  2. Beschränkungsinformation: Der wahre Parameter xx^* erfüllt typischerweise Beschränkungen, die auf vorherigem physikalischem Wissen basieren (wie Nichtnegativität x0x^* \geq 0)
  3. Gleichzeitige Überdeckung: Es ist erforderlich, die gleichzeitige frequentistische Überdeckung aller Funktionale zu garantieren, nicht nur die marginale Überdeckung

Einschränkungen bestehender Methoden

  1. Konservativität: Die traditionelle Methode der gleichzeitigen strikten Grenzen (SSB) ist übermäßig konservativ und konstruiert zunächst einen Konfidenzbereich für xx^*, um ihn dann in den Funktionalraum abzubilden
  2. Rechteck-Einschränkung: Bestehende Methoden erzeugen typischerweise hyperrechteckige Konfidenzregionen, die die Abhängigkeitsstruktur zwischen Funktionalen nicht erfassen können
  3. Kalibrierungsprobleme: Historische Methoden wie die Burrus-Vermutung mangelt es an rigorosen theoretischen Garantien

Kernbeiträge

  1. Einheitliches Framework: Vereinheitlicht Methoden zur Konstruktion von Einzel- und Mehrfunktional-Konfidenzregionen unter Beschränkungen durch die Perspektive der Testinversion
  2. Theoretische Durchbrüche:
    • Beweis der Konvexität der Quantilfunktionen der Teststatistiken λu2\lambda_u^2 und λ1\lambda^1
    • Bestimmung der optimalen Lösungslage von Quantil-Optimierungsproblemen
    • Etablierung von stochastischen Dominanzbeziehungen zwischen Teststatistiken
  3. Praktische Algorithmen:
    • Optimale Kalibrierungskonstanten für Nichtnegativi­täts­beschränkungen
    • Entwicklung der TFM-Reduktionsmethode für hochdimensionale Probleme
    • Vorschlag von Zeilenraum-/Nullraum-Trennungstechniken
  4. Leistungsverbesserung: Signifikante Reduktion des Konfidenzregionsvolumens im Vergleich zu klassischen Methoden bei Beibehaltung der nominalen Überdeckungsrate

Methodische Details

Aufgabendefinition

Gegeben eine Matrix HRk×pH \in \mathbb{R}^{k \times p}, besteht das Ziel darin, einen endlichen Stichproben-1α1-\alpha frequentistischen Konfidenzbereich Rα(y)RkR_\alpha(y) \subseteq \mathbb{R}^k für den unbekannten Vektor HxRkHx^* \in \mathbb{R}^k zu konstruieren, so dass: PyPx(HxRα(y))1αP_{y \sim P_x}(Hx \in R_\alpha(y)) \geq 1-\alpha für alle xXx \in \mathcal{X} (Beschränkungsmenge) gilt.

Testinversions-Framework

Überprüfung des Einzel-Funktional-Falls

Für jeden μR\mu \in \mathbb{R} betrachten Sie den Hypothesentest: H0:xΦμXvsH1:xXΦμH_0: x^* \in \Phi_\mu \cap \mathcal{X} \quad \text{vs} \quad H_1: x^* \in \mathcal{X} \setminus \Phi_\mu wobei Φμ={xRp:hTx=μ}\Phi_\mu = \{x \in \mathbb{R}^p: h^T x = \mu\}.

Erweiterung auf mehrere Funktionale

Für μRk\mu \in \mathbb{R}^k definieren Sie Φμ={xRp:Hx=μ}\Phi_\mu = \{x \in \mathbb{R}^p: Hx = \mu\}, und der Hypothesentest wird zu: H0:xΦμXvsH1:xXΦμH_0: x^* \in \Phi_\mu \cap \mathcal{X} \quad \text{vs} \quad H_1: x^* \in \mathcal{X} \setminus \Phi_\mu

Drei Teststatistiken

Das Papier analysiert drei Teststatistiken:

  1. Beschränkter zweiter Term λc2(μ,y)\lambda_c^2(\mu, y): λc2(μ,y)=minHx=μ,AxbKxy22minAxbKxy22\lambda_c^2(\mu, y) = \min_{Hx=\mu, Ax \leq b} \|Kx - y\|_2^2 - \min_{Ax \leq b} \|Kx - y\|_2^2
  2. Unbeschränkter zweiter Term λu2(μ,y)\lambda_u^2(\mu, y): λu2(μ,y)=minHx=μ,AxbKxy22minxRpKxy22\lambda_u^2(\mu, y) = \min_{Hx=\mu, Ax \leq b} \|Kx - y\|_2^2 - \min_{x \in \mathbb{R}^p} \|Kx - y\|_2^2
  3. Einzelner Term λ1(μ,y)\lambda^1(\mu, y): λ1(μ,y)=minHx=μ,AxbKxy22\lambda^1(\mu, y) = \min_{Hx=\mu, Ax \leq b} \|Kx - y\|_2^2

Kalibrierungsproblem

Für jede Teststatistik müssen Schwellenwerte bestimmt werden, um eine 1α1-\alpha Überdeckungsrate zu garantieren:

  • Schichtweise Schwellenwerte: d(μ)=supHx=μ,AxbQx,1αd^*(\mu) = \sup_{Hx=\mu, Ax \leq b} Q_{x,1-\alpha}
  • Globale Schwellenwerte: D=supAxbQx,1αD^* = \sup_{Ax \leq b} Q_{x,1-\alpha}

wobei Qx,1αQ_{x,1-\alpha} das (1α)(1-\alpha)-Quantil von Zx=λ(Hx,Kx+ε)Z_x = \lambda(Hx, Kx + \varepsilon) ist.

Wichtige theoretische Ergebnisse

Konvexitätssatz

Satz 5.4: Für beliebige feste 0<α<10 < \alpha < 1 ist die Quantilfunktion Qu2(x)Q_u^2(x) eine konvexe Funktion von xx.

Maximierungssatz

Satz 5.6 (Lineare Beschränkungen): Unter linearen Beschränkungen AxbAx^* \leq b gilt: supxPQu2(x)=maxi=1:mQu2(pi)\sup_{x \in P} Q_u^2(x) = \max_{i=1:m} Q_u^2(p_i) wobei {pi}i=1m\{p_i\}_{i=1}^m die Menge der Extremalpunkte des Polyeders PP ist.

Satz 5.7 (Kegel-Beschränkungen): Unter Kegel-Beschränkungen xCx^* \in C gilt: supxCQu2(x)=Qu2(0)\sup_{x \in C} Q_u^2(x) = Q_u^2(0)

Experimentelle Einrichtung

Numerische Beispiele

Betrachten Sie das Nichtnegativi­täts­beschränkungs­problem: y=Kx+ε,εN(0,I),x0y = Kx + \varepsilon, \quad \varepsilon \sim N(0, I), \quad x^* \geq 0 wobei: K=(211011),H=(110011)K = \begin{pmatrix} 2 & 1 & 1 \\ 0 & 1 & 1 \end{pmatrix}, \quad H = \begin{pmatrix} 1 & -1 & 0 \\ 0 & 1 & -1 \end{pmatrix}

Vergleichsmethoden

  1. SSB_x: Begrenzungsrahmen der xx-Beschreibung der gleichzeitigen strikten Grenzen
  2. SSB_μ: μ\mu-Beschreibung der gleichzeitigen strikten Grenzen
  3. QuantileZero_x/μ: Verbesserte Version mit optimalen Konstanten
  4. Bonferroni: Bonferroni-Korrektur von Produktintervallen
  5. Split-Methode: Zeilenraum-/Nullraum-Trennungstechnik

Bewertungsmetriken

  • Empirische Überdeckungsrate: Verifiziert durch N=105N = 10^5 Resampling-Durchläufe
  • Regionsfläche: Berechnet mit Polarkoordinaten-Integration

Experimentelle Ergebnisse

Hauptergebnisse

Konfidenzregionen für feste Beobachtungswerte

Für y=(0,0)y = (0,0) und y=(20,10)y = (20,10) erzeugen μ\mu-Beschreibungsmethoden konvexe Mengen, die streng in den xx-Beschreibungs-Begrenzungsrahmen eingebettet sind, was die Regionsfläche erheblich reduziert.

Überdeckungs- und Flächenverteilung

  • x=(0,0,0)x^* = (0,0,0): Die QuantileZero_μ-Methode erreicht eine nahezu exakte 68%-Überdeckungsrate mit minimaler durchschnittlicher Fläche
  • x=(5,5,5)x^* = (5,5,5): Alle Methoden zeigen Überdeckung, aber die μ\mu-Beschreibungsmethode hat immer noch erhebliche Flächenvorteile

Quantifizierte Verbesserungen

  1. Kalibrierungskonstanten-Verbesserung: Für 68%- und 95%-Konfidenzniveaus sind die optimalen Konstanten 1,644 bzw. 5,139, was eine signifikante Verbesserung gegenüber 2,279 und 5,991 der χ22\chi^2_2-Verteilung darstellt
  2. Flächenreduktion: Die μ\mu-Beschreibung reduziert die durchschnittliche Fläche um etwa 30-50% im Vergleich zum xx-Beschreibungs-Begrenzungsrahmen

Verwandte Arbeiten

Historische Entwicklung

  1. Burrus (1964): Erste Vorschlag einer Optimierungsmethode für beschränkte Konfidenzintervalle
  2. Rust & O'Leary (1986): Entwicklung praktischer Algorithmen
  3. Stark (1992): Vorschlag der Methode strikter Grenzen
  4. Tenorio et al. (2007): Entwicklung der TFM-Reduktionsmethode

Moderne Fortschritte

  • Batlle et al. (2023): Widerlegung der Burrus-Vermutung durch das Testinversions-Framework
  • Literatur zu beschränkter Inferenz: Verbindungen zur χ2\chi^2-bar-Verteilungstheorie
  • Konforme Vorhersage: Unterschiede in Zielen und Annahmen

Schlussfolgerungen und Diskussion

Hauptschlussfolgerungen

  1. Theoretischer Beitrag: Etablierung eines einheitlichen Testinversions-Frameworks für Mehrfunktional-Konfidenzregionen unter Beschränkungen
  2. Rechnerische Vorteile: Bereitstellung skalierbarer Algorithmen für hochdimensionale Probleme
  3. Leistungsverbesserung: Signifikante Reduktion des Konfidenzregionsvolumens im Vergleich zu klassischen Methoden

Einschränkungen

  1. λc2\lambda_c^2 Statistik: Quantilfunktion mangelt es an Konvexität, Maximierungsproblem bleibt offen
  2. Rechenkomplexität: Suche nach Extremalpunkten kann in hohen Dimensionen schwierig sein
  3. Schichtweise Schwellenwerte: Berechnung der gesamten Funktion d(μ)d^*(\mu) ist typischerweise herausfordernd

Zukünftige Richtungen

  1. Nicht-Gaußsche Erweiterung: Erweiterung auf allgemeine log-konkave Verteilungen
  2. λc2\lambda_c^2 Kalibrierung: Entwicklung von Kalibrierungsalgorithmen für die beschränkte zweite Term-Statistik
  3. Asymptotische Theorie: Untersuchung von Großstichproben-Eigenschaften
  4. Anwendungsfelder: Erweiterung auf Formbeschränkungen und andere statistische Probleme

Tiefgreifende Bewertung

Stärken

  1. Theoretische Strenge: Bereitstellung eines vollständigen mathematischen Frameworks mit Konvexitätsbeweisen und Optimalitätsergebnissen
  2. Praktischer Wert: Entwicklung skalierbarer Algorithmen zur Lösung hochdimensionaler praktischer Probleme
  3. Einheitliche Perspektive: Vereinheitlichung historisch verstreuter Methoden unter dem Testinversions-Framework
  4. Signifikante Verbesserung: Erhebliche Reduktion der Konfidenzregionen bei Beibehaltung theoretischer Garantien

Mängel

  1. Theoretische Lücken: Vollständige Theorie für die λc2\lambda_c^2 Statistik bleibt zu etablieren
  2. Rechnerische Einschränkungen: Rechenkomplexität in bestimmten hochdimensionalen Fällen
  3. Experimenteller Umfang: Relativ einfache numerische Experimente, Mangel an komplexen praktischen Anwendungen

Einfluss

  1. Akademischer Beitrag: Bereitstellung neuer theoretischer Grundlagen für die Unsicherheitsquantifizierung in beschränkten inversen Problemen
  2. Praktische Anwendung: Breite Anwendungsperspektiven in Naturwissenschaften, Ingenieurwesen und anderen Bereichen, die beschränkte Inferenz erfordern
  3. Methodologische Bedeutung: Das Testinversions-Framework könnte die Lösung anderer statistischer Probleme inspirieren

Anwendungsszenarien

  • Mehrfunktional-Simultane Inferenz in linearen inversen Problemen
  • Parameterschätzung mit physikalischen Beschränkungen
  • Wissenschaftliche Berechnungen, die strenge frequentistische Garantien erfordern
  • Unsicherheitsquantifizierung in hochdimensionalen beschränkten Optimierungsproblemen

Literaturverzeichnis

Das Papier zitiert 47 relevante Referenzen, die wichtige Arbeiten aus mehreren Bereichen wie beschränkte Inferenz, inverse Probleme, Optimierungstheorie und Statistik abdecken und eine solide theoretische Grundlage für die Forschung bieten.