2025-11-25T18:34:18.645261

Simultaneous Frequentist Calibration of Confidence Regions for Multiple Functionals in Constrained Inverse Problems

Batlle, Patil, Stanley et al.

Many scientific analyses require simultaneous comparison of multiple functionals of an unknown signal at once, calling for multidimensional confidence regions with guaranteed simultaneous frequentist under structural constraints (e.g., non-negativity, shape, or physics-based). This paper unifies and extends many previous optimization-based approaches to constrained confidence region construction in linear inverse problems through the lens of statistical test inversion. We begin by reviewing the historical development of optimization-based confidence intervals for the single-functional setting, from "strict bounds" to the Burrus conjecture and its recent refutation via the aforementioned test inversion framework. We then extend this framework to the multiple-functional setting. This framework can be used to: (i) improve the calibration constants of previous methods, yielding smaller confidence regions that still preserve frequentist coverage, (ii) obtain tractable multidimensional confidence regions that need not be hyper-rectangles to better capture functional dependence structure, and (iii) generalize beyond Gaussian error distributions to generic log-concave error distributions. We provide theory establishing nominal simultaneous coverage of our methods and show quantitative volume improvements relative to prior approaches using numerical experiments.

academic

المعايرة المتزامنة للتكرار للمناطق الثقة لعدة دوال في مسائل معكوسة مقيدة

المعلومات الأساسية

معرّف الورقة: 2510.11708
العنوان: المعايرة المتزامنة للتكرار للمناطق الثقة لعدة دوال في مسائل معكوسة مقيدة
المؤلفون: Pau Batlle, Pratik Patil, Michael Stanley, Javier Ruiz Lupon, Houman Owhadi, Mikael Kuusela
التصنيف: math.ST stat.TH
تاريخ النشر: 13 أكتوبر 2025
رابط الورقة: https://arxiv.org/abs/2510.11708

الملخص

تتطلب العديد من التحليلات العلمية المقارنة المتزامنة لعدة دوال للإشارة المجهولة، مما يستلزم بناء مناطق ثقة متعددة الأبعاد مع ضمانات تغطية تكرارية متزامنة تحت القيود الهيكلية (مثل عدم السلبية والقيود المستندة إلى الفيزياء). تقدم هذه الورقة إطار عمل موحد وموسع لطرق بناء مناطق الثقة القائمة على التحسين في مسائل معكوسة خطية مقيدة من خلال منظور اختبار الانعكاس الإحصائي. تستعرض الورقة أولاً التطور التاريخي لفترات الثقة القائمة على التحسين في إعداد الدالة الواحدة، من "الحدود الصارمة" إلى حدسية بوروس وتفنيدها الأخير من خلال إطار اختبار الانعكاس. ثم تمتد الإطار إلى إعداد متعدد الدوال. يمكن استخدام الإطار لـ: (i) تحسين ثوابت المعايرة للطرق السابقة، مما ينتج عنه مناطق ثقة أصغر مع الحفاظ على التغطية التكرارية؛ (ii) الحصول على مناطق ثقة متعددة الأبعاد قابلة للتعامل معها والتي لا تكون بالضرورة فائقة المستطيلة، لالتقاط هيكل الاعتماد بين الدوال بشكل أفضل؛ (iii) التعميم من توزيعات الأخطاء الغاوسية إلى توزيعات الأخطاء اللوغاريتمية المقعرة بشكل عام.

خلفية البحث والدافع

تعريف المشكلة

تدرس هذه الورقة مشكلة بناء مناطق ثقة متزامنة لعدة دوال في المسائل المعكوسة الخطية. نعتبر المسألة المعكوسة الخطية: $y = Kx^* + \varepsilon$ حيث $y \in \mathbb{R}^n$ هي القيم المرصودة، و $x^* \in \mathbb{R}^p$ هي المعاملات المجهولة، و $K \in \mathbb{R}^{n \times p}$ هي المشغل الأمامي المعروف، و $\varepsilon \in \mathbb{R}^n$ هي الضوضاء العشوائية.

دافع البحث

الحاجة العلمية: تتطلب العديد من التحليلات العلمية الاستدلال المتزامن على عدة دوال خطية $Hx^*$ للإشارة المجهولة، بدلاً من تقدير المعامل عالي الأبعاد الكامل $x^*$
المعلومات المقيدة: عادة ما يرضي المعامل الحقيقي $x^*$ قيوداً مستندة إلى المعرفة الفيزيائية السابقة (مثل عدم السلبية $x^* \geq 0$ )
التغطية المتزامنة: يجب ضمان التغطية التكرارية المتزامنة لجميع الدوال، وليس التغطية الهامشية فقط

قيود الطرق الموجودة

المحافظة: طرق الحدود الصارمة المتزامنة (SSB) التقليدية محافظة جداً، حيث تبني أولاً مجموعة ثقة لـ $x^*$ ثم تعينها إلى فضاء الدوال
قيود المستطيل: عادة ما تنتج الطرق الموجودة مناطق ثقة فائقة المستطيلة، وغير قادرة على التقاط هيكل الاعتماد بين الدوال
مشاكل المعايرة: تفتقر الطرق التاريخية مثل حدسية بوروس إلى ضمانات نظرية صارمة

المساهمات الأساسية

إطار عمل موحد: توحيد طرق بناء مناطق الثقة المقيدة أحادية الدالة ومتعددة الدوال من خلال منظور اختبار الانعكاس
اختراقات نظرية:
- إثبات التحدب لدوال الكميات المقابلة لإحصائيات الاختبار $\lambda_u^2$ و $\lambda^1$
- تحديد موقع الحل الأمثل لمشاكل تحسين الكميات
- إنشاء علاقات الهيمنة العشوائية بين إحصائيات الاختبار
خوارزميات عملية:
- توفير ثوابت معايرة مثلى لمسائل القيود غير السالبة
- تطوير طريقة اختزال TFM للمسائل عالية الأبعاد
- اقتراح تقنيات فصل فضاء الصفوف/فضاء الصفر
تحسن الأداء: تقليل حجم مناطق الثقة بشكل كبير مقارنة بالطرق الكلاسيكية مع الحفاظ على معدل التغطية الاسمي

شرح الطريقة

تعريف المهمة

بالنظر إلى المصفوفة $H \in \mathbb{R}^{k \times p}$ ، الهدف هو بناء مجموعة ثقة تكرارية $1-\alpha$ محدودة العينة $R_\alpha(y) \subseteq \mathbb{R}^k$ للمتجه المجهول $Hx^* \in \mathbb{R}^k$ ، بحيث: $P_{y \sim P_x}(Hx \in R_\alpha(y)) \geq 1-\alpha$ لجميع $x \in \mathcal{X}$ (مجموعة القيود).

إطار اختبار الانعكاس

مراجعة حالة الدالة الواحدة

لكل $\mu \in \mathbb{R}$ ، نعتبر اختبار الفرضية: $H_0: x^* \in \Phi_\mu \cap \mathcal{X} \quad \text{مقابل} \quad H_1: x^* \in \mathcal{X} \setminus \Phi_\mu$ حيث $\Phi_\mu = \{x \in \mathbb{R}^p: h^T x = \mu\}$ .

التمديد متعدد الدوال

لـ $\mu \in \mathbb{R}^k$ ، نعرّف $\Phi_\mu = \{x \in \mathbb{R}^p: Hx = \mu\}$ ، يصبح اختبار الفرضية: $H_0: x^* \in \Phi_\mu \cap \mathcal{X} \quad \text{مقابل} \quad H_1: x^* \in \mathcal{X} \setminus \Phi_\mu$

ثلاث إحصائيات اختبار

تحلل الورقة ثلاث إحصائيات اختبار:

الحد الثاني المقيد $\lambda_c^2(\mu, y)$ : $\lambda_c^2(\mu, y) = \min_{Hx=\mu, Ax \leq b} \|Kx - y\|_2^2 - \min_{Ax \leq b} \|Kx - y\|_2^2$
الحد الثاني غير المقيد $\lambda_u^2(\mu, y)$ : $\lambda_u^2(\mu, y) = \min_{Hx=\mu, Ax \leq b} \|Kx - y\|_2^2 - \min_{x \in \mathbb{R}^p} \|Kx - y\|_2^2$
الحد الواحد $\lambda^1(\mu, y)$ : $\lambda^1(\mu, y) = \min_{Hx=\mu, Ax \leq b} \|Kx - y\|_2^2$

مشكلة المعايرة

لكل إحصائية اختبار، يجب تحديد عتبة لضمان معدل تغطية $1-\alpha$ :

العتبة المقسمة: $d^*(\mu) = \sup_{Hx=\mu, Ax \leq b} Q_{x,1-\alpha}$
العتبة العامة: $D^* = \sup_{Ax \leq b} Q_{x,1-\alpha}$

حيث $Q_{x,1-\alpha}$ هي الكمية $(1-\alpha)$ لـ $Z_x = \lambda(Hx, Kx + \varepsilon)$ .

النتائج النظرية الرئيسية

نظرية التحدب

النظرية 5.4: لأي $0 < \alpha < 1$ ثابت، دالة الكمية $Q_u^2(x)$ هي دالة محدبة في $x$ .

نظرية التعظيم

النظرية 5.6 (القيود الخطية): تحت القيود الخطية $Ax^* \leq b$ ، $\sup_{x \in P} Q_u^2(x) = \max_{i=1:m} Q_u^2(p_i)$ حيث $\{p_i\}_{i=1}^m$ هي مجموعة النقاط الطرفية للمتعدد الوجوه $P$ .

النظرية 5.7 (قيود المخروط): تحت قيود المخروط $x^* \in C$ ، $\sup_{x \in C} Q_u^2(x) = Q_u^2(0)$

الإعداد التجريبي

الأمثلة الرقمية

نعتبر مشكلة القيود غير السالبة: $y = Kx + \varepsilon, \quad \varepsilon \sim N(0, I), \quad x^* \geq 0$ حيث: $K = \begin{pmatrix} 2 & 1 & 1 \\ 0 & 1 & 1 \end{pmatrix}, \quad H = \begin{pmatrix} 1 & -1 & 0 \\ 0 & 1 & -1 \end{pmatrix}$

الطرق المقارنة

SSB_x: حدود الصندوق الموصوفة بـ $x$ للحدود الصارمة المتزامنة
SSB_μ: الوصف الموصوف بـ $\mu$ للحدود الصارمة المتزامنة
QuantileZero_x/μ: النسخة المحسنة باستخدام الثابت الأمثل
Bonferroni: فترات المنتج المصححة بـ Bonferroni
طريقة Split: تقنية فصل فضاء الصفوف/فضاء الصفر

مؤشرات التقييم

معدل التغطية التجريبي: التحقق من خلال إعادة العينات $N = 10^5$
منطقة المنطقة: حساب مساحة منطقة الثقة باستخدام التكامل بالإحداثيات القطبية

نتائج التجارب

النتائج الرئيسية

مناطق الثقة للقيمة المرصودة الثابتة

بالنسبة لـ $y = (0,0)$ و $y = (20,10)$ ، تنتج الطرق الموصوفة بـ $\mu$ مجموعات محدبة تحتويها بدقة حدود الصندوق الموصوفة بـ $x$ ، مما يقلل بشكل كبير من مساحة المنطقة.

توزيع التغطية والمساحة

$x^* = (0,0,0)$ : تحقق طريقة QuantileZero_μ معدل تغطية دقيق تقريباً بنسبة 68%، بأصغر متوسط مساحة
$x^* = (5,5,5)$ : جميع الطرق تحقق التغطية، لكن الطريقة الموصوفة بـ $\mu$ لا تزال لها ميزة كبيرة في المساحة

التحسينات الكمية

تحسن ثابت المعايرة: لمستويات الثقة 68% و 95%، الثوابت المثلى هي 1.644 و 5.139 على التوالي، مع تحسن كبير مقارنة بـ 2.279 و 5.991 لتوزيع $\chi^2_2$
تقليل المساحة: الوصف الموصوف بـ $\mu$ يقلل متوسط المساحة بحوالي 30-50% مقارنة بحدود الصندوق الموصوفة بـ $x$

الأعمال ذات الصلة

التطور التاريخي

Burrus (1964): اقترح لأول مرة طريقة التحسين للفترات الثقة المقيدة
Rust & O'Leary (1986): طوروا خوارزميات عملية
Stark (1992): اقترح طريقة الحدود الصارمة
Tenorio وآخرون (2007): طوروا تقنية اختزال TFM

التقدم الحديث

Batlle وآخرون (2023): تفنيد حدسية بوروس من خلال إطار اختبار الانعكاس
أدبيات الاستدلال المقيد: الارتباط بنظرية توزيع $\chi^2$ -bar
التنبؤ المطابق: الاختلافات في الأهداف والافتراضات

الخلاصة والمناقشة

الاستنتاجات الرئيسية

المساهمات النظرية: إنشاء إطار عمل موحد لاختبار الانعكاس لمناطق الثقة المقيدة متعددة الدوال
المزايا الحسابية: توفير خوارزميات قابلة للتوسع للمسائل عالية الأبعاد
تحسن الأداء: تقليل حجم مناطق الثقة بشكل كبير مقارنة بالطرق الكلاسيكية

القيود

إحصائية $\lambda_c^2$ : تفتقر دالة الكمية إلى التحدب، وتبقى مشكلة التعظيم مفتوحة
التعقيد الحسابي: قد يكون البحث عن النقاط الطرفية صعباً في الحالات عالية الأبعاد
العتبات المقسمة: حساب الدالة الكاملة $d^*(\mu)$ عادة ما يكون تحدياً

الاتجاهات المستقبلية

التمديد غير الغاوسي: التمديد إلى توزيعات الأخطاء اللوغاريتمية المقعرة بشكل عام
معايرة $\lambda_c^2$ : تطوير خوارزميات معايرة لإحصائية الحد الثاني المقيد
النظرية المقاربة: دراسة الخصائص في العينات الكبيرة
مجالات التطبيق: التمديد إلى القيود على الشكل والمسائل الإحصائية الأخرى

التقييم المتعمق

المزايا

الصرامة النظرية: توفير إطار عمل رياضي كامل يتضمن إثباتات التحدب ونتائج الأمثلية
القيمة العملية: تطوير خوارزميات قابلة للتوسع لحل المسائل الفعلية عالية الأبعاد
المنظور الموحد: توحيد الطرق المتفرقة تاريخياً تحت إطار اختبار الانعكاس
التحسينات الملحوظة: تقليل كبير في مناطق الثقة مع الحفاظ على الضمانات النظرية

أوجه القصور

الفجوات النظرية: لم يتم بعد إنشاء النظرية الكاملة لإحصائية $\lambda_c^2$
القيود الحسابية: التعقيد الحسابي في بعض الحالات عالية الأبعاد
نطاق التجارب: التجارب الرقمية نسبياً بسيطة، تفتقد التطبيقات الفعلية المعقدة

التأثير

المساهمة الأكاديمية: توفير أساس نظري جديد لقياس عدم اليقين في المسائل المعكوسة المقيدة
التطبيقات العملية: آفاق تطبيق واسعة في العلوم الفيزيائية والهندسة والمجالات الأخرى التي تتطلب استدلالاً مقيداً
الأهمية المنهجية: قد يلهم إطار اختبار الانعكاس حل المسائل الإحصائية الأخرى

السيناريوهات المعمول بها

الاستدلال المتزامن متعدد الدوال في المسائل المعكوسة الخطية
تقدير المعاملات مع القيود الفيزيائية
الحسابات العلمية التي تتطلب ضمانات تكرارية صارمة
قياس عدم اليقين في مسائل التحسين المقيدة عالية الأبعاد

المراجع

تستشهد الورقة بـ 47 مرجعاً ذا صلة، تغطي الأعمال المهمة في مجالات الاستدلال المقيد والمسائل المعكوسة ونظرية التحسين والإحصاء، مما يوفر أساساً نظرياً متيناً للبحث.