Many scientific analyses require simultaneous comparison of multiple functionals of an unknown signal at once, calling for multidimensional confidence regions with guaranteed simultaneous frequentist under structural constraints (e.g., non-negativity, shape, or physics-based). This paper unifies and extends many previous optimization-based approaches to constrained confidence region construction in linear inverse problems through the lens of statistical test inversion. We begin by reviewing the historical development of optimization-based confidence intervals for the single-functional setting, from "strict bounds" to the Burrus conjecture and its recent refutation via the aforementioned test inversion framework. We then extend this framework to the multiple-functional setting. This framework can be used to: (i) improve the calibration constants of previous methods, yielding smaller confidence regions that still preserve frequentist coverage, (ii) obtain tractable multidimensional confidence regions that need not be hyper-rectangles to better capture functional dependence structure, and (iii) generalize beyond Gaussian error distributions to generic log-concave error distributions. We provide theory establishing nominal simultaneous coverage of our methods and show quantitative volume improvements relative to prior approaches using numerical experiments.
- Paper-ID: 2510.11708
- Titel: Simultane Frequentistische Kalibrierung von Konfidenzregionen für mehrere Funktionale in beschränkten inversen Problemen
- Autoren: Pau Batlle, Pratik Patil, Michael Stanley, Javier Ruiz Lupon, Houman Owhadi, Mikael Kuusela
- Klassifizierung: math.ST stat.TH
- Veröffentlichungsdatum: 13. Oktober 2025
- Paper-Link: https://arxiv.org/abs/2510.11708
Viele wissenschaftliche Analysen erfordern den gleichzeitigen Vergleich mehrerer Funktionale eines unbekannten Signals, was die Konstruktion mehrdimensionaler Konfidenzregionen mit garantierter gleichzeitiger frequentistischer Überdeckung unter strukturellen Beschränkungen (wie Nichtnegativität, Form oder physikalisch begründete Beschränkungen) erfordert. Dieses Papier vereinheitlicht und erweitert optimierungsbasierte Methoden zur Konstruktion von Konfidenzregionen in beschränkten linearen inversen Problemen durch die Perspektive der statistischen Testinversion. Das Papier überprüft zunächst die historische Entwicklung optimierungsbasierter Konfidenzintervalle in der Einzel-Funktional-Einstellung, von „strikten Grenzen" bis zur Burrus-Vermutung und ihrer jüngsten Widerlegung durch das Testinversions-Framework. Anschließend wird das Framework auf die Mehrfunktional-Einstellung erweitert. Das Framework kann verwendet werden für: (i) Verbesserung der Kalibrierungskonstanten vorheriger Methoden, die kleinere, aber weiterhin frequentistisch überdeckte Konfidenzregionen erzeugen; (ii) Erhalt von handhabbaren mehrdimensionalen Konfidenzregionen, die nicht notwendigerweise hyperrechteckig sind, um die Abhängigkeitsstruktur zwischen Funktionalen besser zu erfassen; (iii) Verallgemeinerung von Gaußschen Fehlerverteilungen auf allgemeine log-konkave Fehlerverteilungen.
Dieses Papier untersucht die Konstruktion gleichzeitiger Konfidenzregionen für mehrere Funktionale in linearen inversen Problemen. Betrachten Sie das lineare inverse Problem:
y=Kx∗+ε
wobei y∈Rn die Beobachtungen, x∗∈Rp die unbekannten Parameter, K∈Rn×p der bekannte Vorwärtsoperator und ε∈Rn das Zufallsrauschen ist.
- Wissenschaftliche Anforderungen: Viele wissenschaftliche Analysen erfordern die gleichzeitige Inferenz mehrerer linearer Funktionale Hx∗ des unbekannten Signals, anstatt den gesamten hochdimensionalen Parameter x∗ zu schätzen
- Beschränkungsinformation: Der wahre Parameter x∗ erfüllt typischerweise Beschränkungen, die auf vorherigem physikalischem Wissen basieren (wie Nichtnegativität x∗≥0)
- Gleichzeitige Überdeckung: Es ist erforderlich, die gleichzeitige frequentistische Überdeckung aller Funktionale zu garantieren, nicht nur die marginale Überdeckung
- Konservativität: Die traditionelle Methode der gleichzeitigen strikten Grenzen (SSB) ist übermäßig konservativ und konstruiert zunächst einen Konfidenzbereich für x∗, um ihn dann in den Funktionalraum abzubilden
- Rechteck-Einschränkung: Bestehende Methoden erzeugen typischerweise hyperrechteckige Konfidenzregionen, die die Abhängigkeitsstruktur zwischen Funktionalen nicht erfassen können
- Kalibrierungsprobleme: Historische Methoden wie die Burrus-Vermutung mangelt es an rigorosen theoretischen Garantien
- Einheitliches Framework: Vereinheitlicht Methoden zur Konstruktion von Einzel- und Mehrfunktional-Konfidenzregionen unter Beschränkungen durch die Perspektive der Testinversion
- Theoretische Durchbrüche:
- Beweis der Konvexität der Quantilfunktionen der Teststatistiken λu2 und λ1
- Bestimmung der optimalen Lösungslage von Quantil-Optimierungsproblemen
- Etablierung von stochastischen Dominanzbeziehungen zwischen Teststatistiken
- Praktische Algorithmen:
- Optimale Kalibrierungskonstanten für Nichtnegativitätsbeschränkungen
- Entwicklung der TFM-Reduktionsmethode für hochdimensionale Probleme
- Vorschlag von Zeilenraum-/Nullraum-Trennungstechniken
- Leistungsverbesserung: Signifikante Reduktion des Konfidenzregionsvolumens im Vergleich zu klassischen Methoden bei Beibehaltung der nominalen Überdeckungsrate
Gegeben eine Matrix H∈Rk×p, besteht das Ziel darin, einen endlichen Stichproben-1−α frequentistischen Konfidenzbereich Rα(y)⊆Rk für den unbekannten Vektor Hx∗∈Rk zu konstruieren, so dass:
Py∼Px(Hx∈Rα(y))≥1−α
für alle x∈X (Beschränkungsmenge) gilt.
Für jeden μ∈R betrachten Sie den Hypothesentest:
H0:x∗∈Φμ∩XvsH1:x∗∈X∖Φμ
wobei Φμ={x∈Rp:hTx=μ}.
Für μ∈Rk definieren Sie Φμ={x∈Rp:Hx=μ}, und der Hypothesentest wird zu:
H0:x∗∈Φμ∩XvsH1:x∗∈X∖Φμ
Das Papier analysiert drei Teststatistiken:
- Beschränkter zweiter Term λc2(μ,y):
λc2(μ,y)=minHx=μ,Ax≤b∥Kx−y∥22−minAx≤b∥Kx−y∥22
- Unbeschränkter zweiter Term λu2(μ,y):
λu2(μ,y)=minHx=μ,Ax≤b∥Kx−y∥22−minx∈Rp∥Kx−y∥22
- Einzelner Term λ1(μ,y):
λ1(μ,y)=minHx=μ,Ax≤b∥Kx−y∥22
Für jede Teststatistik müssen Schwellenwerte bestimmt werden, um eine 1−α Überdeckungsrate zu garantieren:
- Schichtweise Schwellenwerte: d∗(μ)=supHx=μ,Ax≤bQx,1−α
- Globale Schwellenwerte: D∗=supAx≤bQx,1−α
wobei Qx,1−α das (1−α)-Quantil von Zx=λ(Hx,Kx+ε) ist.
Satz 5.4: Für beliebige feste 0<α<1 ist die Quantilfunktion Qu2(x) eine konvexe Funktion von x.
Satz 5.6 (Lineare Beschränkungen): Unter linearen Beschränkungen Ax∗≤b gilt:
supx∈PQu2(x)=maxi=1:mQu2(pi)
wobei {pi}i=1m die Menge der Extremalpunkte des Polyeders P ist.
Satz 5.7 (Kegel-Beschränkungen): Unter Kegel-Beschränkungen x∗∈C gilt:
supx∈CQu2(x)=Qu2(0)
Betrachten Sie das Nichtnegativitätsbeschränkungsproblem:
y=Kx+ε,ε∼N(0,I),x∗≥0
wobei:
K=(201111),H=(10−110−1)
- SSB_x: Begrenzungsrahmen der x-Beschreibung der gleichzeitigen strikten Grenzen
- SSB_μ: μ-Beschreibung der gleichzeitigen strikten Grenzen
- QuantileZero_x/μ: Verbesserte Version mit optimalen Konstanten
- Bonferroni: Bonferroni-Korrektur von Produktintervallen
- Split-Methode: Zeilenraum-/Nullraum-Trennungstechnik
- Empirische Überdeckungsrate: Verifiziert durch N=105 Resampling-Durchläufe
- Regionsfläche: Berechnet mit Polarkoordinaten-Integration
Für y=(0,0) und y=(20,10) erzeugen μ-Beschreibungsmethoden konvexe Mengen, die streng in den x-Beschreibungs-Begrenzungsrahmen eingebettet sind, was die Regionsfläche erheblich reduziert.
- x∗=(0,0,0): Die QuantileZero_μ-Methode erreicht eine nahezu exakte 68%-Überdeckungsrate mit minimaler durchschnittlicher Fläche
- x∗=(5,5,5): Alle Methoden zeigen Überdeckung, aber die μ-Beschreibungsmethode hat immer noch erhebliche Flächenvorteile
- Kalibrierungskonstanten-Verbesserung: Für 68%- und 95%-Konfidenzniveaus sind die optimalen Konstanten 1,644 bzw. 5,139, was eine signifikante Verbesserung gegenüber 2,279 und 5,991 der χ22-Verteilung darstellt
- Flächenreduktion: Die μ-Beschreibung reduziert die durchschnittliche Fläche um etwa 30-50% im Vergleich zum x-Beschreibungs-Begrenzungsrahmen
- Burrus (1964): Erste Vorschlag einer Optimierungsmethode für beschränkte Konfidenzintervalle
- Rust & O'Leary (1986): Entwicklung praktischer Algorithmen
- Stark (1992): Vorschlag der Methode strikter Grenzen
- Tenorio et al. (2007): Entwicklung der TFM-Reduktionsmethode
- Batlle et al. (2023): Widerlegung der Burrus-Vermutung durch das Testinversions-Framework
- Literatur zu beschränkter Inferenz: Verbindungen zur χ2-bar-Verteilungstheorie
- Konforme Vorhersage: Unterschiede in Zielen und Annahmen
- Theoretischer Beitrag: Etablierung eines einheitlichen Testinversions-Frameworks für Mehrfunktional-Konfidenzregionen unter Beschränkungen
- Rechnerische Vorteile: Bereitstellung skalierbarer Algorithmen für hochdimensionale Probleme
- Leistungsverbesserung: Signifikante Reduktion des Konfidenzregionsvolumens im Vergleich zu klassischen Methoden
- λc2 Statistik: Quantilfunktion mangelt es an Konvexität, Maximierungsproblem bleibt offen
- Rechenkomplexität: Suche nach Extremalpunkten kann in hohen Dimensionen schwierig sein
- Schichtweise Schwellenwerte: Berechnung der gesamten Funktion d∗(μ) ist typischerweise herausfordernd
- Nicht-Gaußsche Erweiterung: Erweiterung auf allgemeine log-konkave Verteilungen
- λc2 Kalibrierung: Entwicklung von Kalibrierungsalgorithmen für die beschränkte zweite Term-Statistik
- Asymptotische Theorie: Untersuchung von Großstichproben-Eigenschaften
- Anwendungsfelder: Erweiterung auf Formbeschränkungen und andere statistische Probleme
- Theoretische Strenge: Bereitstellung eines vollständigen mathematischen Frameworks mit Konvexitätsbeweisen und Optimalitätsergebnissen
- Praktischer Wert: Entwicklung skalierbarer Algorithmen zur Lösung hochdimensionaler praktischer Probleme
- Einheitliche Perspektive: Vereinheitlichung historisch verstreuter Methoden unter dem Testinversions-Framework
- Signifikante Verbesserung: Erhebliche Reduktion der Konfidenzregionen bei Beibehaltung theoretischer Garantien
- Theoretische Lücken: Vollständige Theorie für die λc2 Statistik bleibt zu etablieren
- Rechnerische Einschränkungen: Rechenkomplexität in bestimmten hochdimensionalen Fällen
- Experimenteller Umfang: Relativ einfache numerische Experimente, Mangel an komplexen praktischen Anwendungen
- Akademischer Beitrag: Bereitstellung neuer theoretischer Grundlagen für die Unsicherheitsquantifizierung in beschränkten inversen Problemen
- Praktische Anwendung: Breite Anwendungsperspektiven in Naturwissenschaften, Ingenieurwesen und anderen Bereichen, die beschränkte Inferenz erfordern
- Methodologische Bedeutung: Das Testinversions-Framework könnte die Lösung anderer statistischer Probleme inspirieren
- Mehrfunktional-Simultane Inferenz in linearen inversen Problemen
- Parameterschätzung mit physikalischen Beschränkungen
- Wissenschaftliche Berechnungen, die strenge frequentistische Garantien erfordern
- Unsicherheitsquantifizierung in hochdimensionalen beschränkten Optimierungsproblemen
Das Papier zitiert 47 relevante Referenzen, die wichtige Arbeiten aus mehreren Bereichen wie beschränkte Inferenz, inverse Probleme, Optimierungstheorie und Statistik abdecken und eine solide theoretische Grundlage für die Forschung bieten.