We consider adaptive increasingly rare Markov chain Monte Carlo (MCMC) algorithms, which are adaptive MCMC methods, where the adaptation concerning the "past'' happens less and less frequently over time. Under a contraction assumption with respect to a Wasserstein-like function we deduce upper bounds of the convergence rate of Monte Carlo sums taking a renormalisation factor into account that is "almost'' the one that appears in a law of the iterated logarithm. We demonstrate the applicability of our results by considering different settings, among which are those of simultaneous geometric and uniform ergodicity. All proofs are carried out on an augmented state space, including the classical non-augmented setting as a special case. In contrast to other adaptive MCMC limit theory, some technical assumptions, like diminishing adaptation, are not needed.
معرّف الورقة : 2402.12122العنوان : معدلات التقارب شبه المؤكد لسلاسل مارkov مونت كارلو التكيفية المتناقصة بشكل متزايدالمؤلفون : جوليان هوفستادلر (جامعة باث)، كريستوف لاتوسزينسكي (جامعة وارويك)، جاريث أو. روبرتس (جامعة وارويك)، دانيال رودولف (جامعة باساو)التصنيفات : math.NA cs.NA math.PR math.ST stat.THتاريخ النشر : 14 أكتوبر 2025 (نسخة arXiv)رابط الورقة : https://arxiv.org/abs/2402.12122 تدرس هذه الورقة خوارزمية سلاسل مارkov مونت كارلو التكيفية المتناقصة بشكل متزايد (AIR MCMC)، وهي فئة من طرق MCMC التكيفية حيث تصبح التعديلات على "الماضي" أكثر ندرة مع مرور الوقت. تحت افتراضات الانكماش المتعلقة بدوال تشبه Wasserstein، يشتق المؤلفون حدود معدل التقارب لمجاميع مونت كارلو، مع الأخذ في الاعتبار عوامل إعادة التطبيع التي تظهر "تقريباً" في قانون اللوغاريتم المتكرر. تثبت الورقة قابلية تطبيق النتائج من خلال النظر في إعدادات مختلفة مثل الإرجوديكية الهندسية المتزامنة والإرجوديكية المنتظمة. يتم إجراء جميع الإثباتات على فضاء الحالة المعزز، مع تضمين الإعدادات غير المعززة الكلاسيكية كحالات خاصة. بالمقارنة مع نظريات الحد الأخرى لـ MCMC التكيفية، لا تتطلب بعض الافتراضات التقنية مثل التكيف المتناقص.
في الإحصاء الحسابي، يتمثل التحدي الشامل في تقريب القيم المتوقعة:
ν ( f ) = ∫ X f ( x ) ν ( d x ) \nu(f) = \int_X f(x)\nu(dx) ν ( f ) = ∫ X f ( x ) ν ( d x )
حيث ν \nu ν هي التوزيع المستهدف و f : X → R f: X \to \mathbb{R} f : X → R هي دالة قابلة للتكامل ذات اهتمام.
صعوبة الأخذ العينات المباشر : عندما يكون الأخذ المباشر من ν \nu ν مستحيلاً أو غير قابل للتطبيق من الناحية الحسابية (على سبيل المثال، الكثافة تحتوي على ثابت تطبيع غير معروف)، هناك حاجة إلى طرق بديلة.تحديات MCMC التكيفية : تحدّث طرق MCMC التكيفية التقليدية آلية الانتقال أحادية الخطوة من خلال النظر في السجل الكامل، مما يؤدي إلى عملية غير ماركوفية، مما يعقد التحليل الرياضي.الحاجة إلى تبسيط الافتراضات التقنية : تتطلب نظرية MCMC التكيفية الحالية عادة افتراضات تقنية (مثل التكيف المتناقص)، مما يحد من قابلية تطبيق الطريقة.الطبيعة غير الماركوفية لـ MCMC التكيفية تؤدي إلى تقنيات إثبات معقدة تتطلب شروط تقنية صارمة لضمان التقارب نقص النتائج المتعلقة بتقارب مجاميع مونت كارلو المعاد تطبيعها اقتراح إطار عمل نظري AIR MCMC : إنشاء نظرية معدل التقارب شبه المؤكد لخوارزميات AIR تحت افتراضات انكماش Wasserstein.معدلات تقارب محسّنة : الحصول على معدلات تقارب من الشكل r ( n ) = n ( log n ) 1 / 2 + ε r(n) = \sqrt{n}(\log n)^{1/2+\varepsilon} r ( n ) = n ( log n ) 1/2 + ε أو r ( n ) = n 1 / 2 + ε r(n) = n^{1/2+\varepsilon} r ( n ) = n 1/2 + ε ، القريبة من معدل التقارب الأمثل لقانون اللوغاريتم المتكرر.تبسيط الافتراضات التقنية : عدم الحاجة إلى افتراضات تقنية تقليدية مثل التكيف المتناقص، مما يوسع نطاق تطبيق الطريقة.تحليل فضاء الحالة المعزز : إجراء التحليل على فضاء الحالة المعزز Y = X × Φ Y = X \times \Phi Y = X × Φ ، مع تضمين الإعدادات غير المعززة الكلاسيكية كحالات خاصة.قابلية تطبيق واسعة : تنطبق النتائج على إعدادات متعددة مثل الإرجوديكية الهندسية والإرجوديكية المنتظمة المتزامنة.بالنظر إلى معامل β > 0 \beta > 0 β > 0 ، حدد k j = ⌈ j β ⌉ k_j = \lceil j^\beta \rceil k j = ⌈ j β ⌉ ، وقم بالتكيف فقط في نقاط زمنية محددة:
T m = ∑ j = 1 m k j T_m = \sum_{j=1}^m k_j T m = ∑ j = 1 m k j
الملاحظة الرئيسية: لأي β > 0 \beta > 0 β > 0 ، توجد ثوابت c β , C β c_\beta, C_\beta c β , C β بحيث:
c β m 1 + β ≤ T m ≤ C β m 1 + β c_\beta m^{1+\beta} \leq T_m \leq C_\beta m^{1+\beta} c β m 1 + β ≤ T m ≤ C β m 1 + β
هذا يعني أن تكرار التكيف يتناقص.
لدالة المسافة d : Y × Y → R + d: Y \times Y \to \mathbb{R}_+ d : Y × Y → R + ، عرّف:
W ( μ 1 , μ 2 ) : = inf ξ ∈ C ( μ 1 , μ 2 ) ∫ Y 2 d ( x , y ) ξ ( d x , d y ) W(\mu_1, \mu_2) := \inf_{\xi \in C(\mu_1,\mu_2)} \int_{Y^2} d(x,y)\xi(dx,dy) W ( μ 1 , μ 2 ) := inf ξ ∈ C ( μ 1 , μ 2 ) ∫ Y 2 d ( x , y ) ξ ( d x , d y )
لكل γ ∈ I \gamma \in I γ ∈ I ، افترض:
π γ \pi_\gamma π γ هي التوزيع الثابت لـ P γ P_\gamma P γ τ ( P γ ) ≤ M \tau(P_\gamma) \leq M τ ( P γ ) ≤ M و τ ( P γ k 0 ) ≤ τ \tau(P_\gamma^{k_0}) \leq \tau τ ( P γ k 0 ) ≤ τ
حيث M ∈ [ 1 , ∞ ) M \in [1,\infty) M ∈ [ 1 , ∞ ) ، τ ∈ [ 0 , 1 ) \tau \in [0,1) τ ∈ [ 0 , 1 ) ، k 0 ∈ N k_0 \in \mathbb{N} k 0 ∈ N مستقلة عن γ \gamma γ .لدالة h : Y → R h: Y \to \mathbb{R} h : Y → R و γ ∈ I \gamma \in I γ ∈ I ، حل معادلة بواسون هو:
u γ ( y ) = ∑ ℓ = 0 ∞ ( P γ ℓ f ( y ) − π γ ( f ) ) u_\gamma(y) = \sum_{\ell=0}^{\infty}(P_\gamma^\ell f(y) - \pi_\gamma(f)) u γ ( y ) = ∑ ℓ = 0 ∞ ( P γ ℓ f ( y ) − π γ ( f ))
استخدم تحلل معادلة بواسون لمجاميع مونت كارلو:
∑ j = 1 n ( h ( Y j ) − π Γ j − 1 ( h ) ) = M n + R m + حدود محدودة \sum_{j=1}^n (h(Y_j) - \pi_{\Gamma_{j-1}}(h)) = M_n + R_m + \text{حدود محدودة} ∑ j = 1 n ( h ( Y j ) − π Γ j − 1 ( h )) = M n + R m + حدود محدودة
حيث:
M n M_n M n : حد المارتينجيلR m R_m R m : الحد المتبقي، يتم تبسيطه بشكل كبير لخوارزمية AIRتحت افتراض الانحراف المحدود، لأي ε > 0 \varepsilon > 0 ε > 0 :
lim n → ∞ 1 n ( log n ) 1 / 2 + ε ∑ j = 1 n ( f ( X j ) − ν ( f ) ) = 0 تقريباً مؤكداً \lim_{n \to \infty} \frac{1}{\sqrt{n}(\log n)^{1/2+\varepsilon}} \sum_{j=1}^n (f(X_j) - \nu(f)) = 0 \quad \text{تقريباً مؤكداً} lim n → ∞ n ( l o g n ) 1/2 + ε 1 ∑ j = 1 n ( f ( X j ) − ν ( f )) = 0 تقريباً مؤكداً
لـ ε > 1 1 + β − 1 2 \varepsilon > \frac{1}{1+\beta} - \frac{1}{2} ε > 1 + β 1 − 2 1 :
lim n → ∞ 1 n 1 / 2 + ε ∑ j = 1 n ( f ( X j ) − ν ( f ) ) = 0 تقريباً مؤكداً \lim_{n \to \infty} \frac{1}{n^{1/2+\varepsilon}} \sum_{j=1}^n (f(X_j) - \nu(f)) = 0 \quad \text{تقريباً مؤكداً} lim n → ∞ n 1/2 + ε 1 ∑ j = 1 n ( f ( X j ) − ν ( f )) = 0 تقريباً مؤكداً
تحت افتراض وجود دالة Lyapunov، لـ ε > max { 0 , 1 1 + β + 1 p − 1 2 } \varepsilon > \max\{0, \frac{1}{1+\beta} + \frac{1}{p} - \frac{1}{2}\} ε > max { 0 , 1 + β 1 + p 1 − 2 1 } :
lim n → ∞ 1 n 1 / 2 + ε ∑ j = 1 n ( f ( X j ) − ν ( f ) ) = 0 تقريباً مؤكداً \lim_{n \to \infty} \frac{1}{n^{1/2+\varepsilon}} \sum_{j=1}^n (f(X_j) - \nu(f)) = 0 \quad \text{تقريباً مؤكداً} lim n → ∞ n 1/2 + ε 1 ∑ j = 1 n ( f ( X j ) − ν ( f )) = 0 تقريباً مؤكداً
استخدم المقياس البديهي d ( y 1 , y 2 ) = 1 { y 1 ≠ y 2 } d(y_1, y_2) = \mathbf{1}_{\{y_1 \neq y_2\}} d ( y 1 , y 2 ) = 1 { y 1 = y 2 } ، حيث يتوافق W W W مع مسافة التباين الكلي.
النتيجة 4.5 : لدالة محدودة f f f ، تحت β ≥ 1 \beta \geq 1 β ≥ 1 و ε > 0 \varepsilon > 0 ε > 0 :
∣ 1 n ∑ j = 1 n ( f ( X j ( ω ) ) − ν ( f ) ) ∣ ≤ ( log n ) 1 / 2 + ε n C ( ω ) \left|\frac{1}{n}\sum_{j=1}^n (f(X_j(\omega)) - \nu(f))\right| \leq \frac{(\log n)^{1/2+\varepsilon}}{\sqrt{n}} C(\omega) n 1 ∑ j = 1 n ( f ( X j ( ω )) − ν ( f )) ≤ n ( l o g n ) 1/2 + ε C ( ω )
ضع في الاعتبار شرط الانجراف والمجموعة الصغيرة (الافتراض 4.7)، واستخدم المقياس المرجح:
d q ( y 1 , y 2 ) = 1 { y 1 ≠ y 2 } ( V q ( y 1 ) + V q ( y 2 ) ) d_q(y_1, y_2) = \mathbf{1}_{\{y_1 \neq y_2\}}(V^q(y_1) + V^q(y_2)) d q ( y 1 , y 2 ) = 1 { y 1 = y 2 } ( V q ( y 1 ) + V q ( y 2 ))
استخدم دالة المسافة:
d ~ q ( y 1 , y 2 ) = d ( y 1 , y 2 ) ( 1 + V q ( y 1 ) + V q ( y 2 ) ) \tilde{d}_q(y_1, y_2) = \sqrt{d(y_1, y_2)(1 + V^q(y_1) + V^q(y_2))} d ~ q ( y 1 , y 2 ) = d ( y 1 , y 2 ) ( 1 + V q ( y 1 ) + V q ( y 2 ))
الميزة الرئيسية لخوارزمية AIR هي أن معظم الحدود الصعبة في الحد المتبقي R m R_m R m تلغي بعضها البعض، بحيث:
∣ R m ∣ ≤ n 1 / ( 1 + β ) ⋅ ثابت |R_m| \leq n^{1/(1+\beta)} \cdot \text{ثابت} ∣ R m ∣ ≤ n 1/ ( 1 + β ) ⋅ ثابت
بخلاف الطرق التقليدية، لا تتطلب افتراض ∥ Γ n − Γ n − 1 ∥ → 0 \|\Gamma_n - \Gamma_{n-1}\| \to 0 ∥ Γ n − Γ n − 1 ∥ → 0 .
من خلال الإعداد Y = X × Φ Y = X \times \Phi Y = X × Φ ، قم بمعالجة موحدة للحالات المعقدة مثل التوزيعات متعددة الأنماط.
الورقة موجهة بشكل أساسي نحو التحليل النظري، مع التحقق من النتائج بالطرق التالية:
خوارزمية Metropolis للمشي العشوائي التكيفي خوارزمية MCMC الإسقاط الكروي التكيفية خوارزمية Crank-Nicolson المسبقة (pCN) الاستشهاد بالتجارب الرقمية من CLR18 ، مما يوضح أن خوارزمية AIR تحقق أداء مماثلة للطرق التكيفية البحتة عند β ∈ [ 1 , 2 ] \beta \in [1,2] β ∈ [ 1 , 2 ] .
قانون الأعداد الكبيرة : HST01, AR05, AM06, RR07, SV10, FMP11, PHL20 نظرية الحد المركزي : AM06, SV10 التقارب إلى مقياس الهدف الصحيح : RR07, FMP11 AA07, AW15 : توضح ∥ P ( X n ∈ ⋅ ) − ν ∥ t v ≤ C / n \|P(X_n \in \cdot) - \nu\|_{tv} \leq C/n ∥ P ( X n ∈ ⋅ ) − ν ∥ t v ≤ C / n AW15, CLR18 : حدود الخطأ التربيعي المتوسط، توضح تقارب الرتبة 1 / n 1/n 1/ n حدود التقارب للمسار : بخلاف حدود الخطأ المتوقعة الموجودة، توفر تقارب المسار شبه المؤكدإعداد انكماش Wasserstein : توسيع الإطار التقليدي للإرجوديكية المنتظمة/الهندسيةمعدل قريب من الأمثل : معدل التقارب قريب من القيمة النظرية المثلى لقانون اللوغاريتم المتكررتتمتع خوارزمية AIR MCMC بخصائص تقارب شبه مؤكدة جيدة تحت افتراضات انكماش Wasserstein معدل التقارب قريب من الأمثل، بصيغة n ( log n ) 1 / 2 + ε \sqrt{n}(\log n)^{1/2+\varepsilon} n ( log n ) 1/2 + ε الافتراضات التقنية مبسطة بشكل كبير مقارنة بالطرق التقليدية متطلبات الاتساق : يتطلب الافتراض 3.1 أن تكون جميع الحدود موحدة فيما يتعلق بـ γ \gamma γ ، وهو أمر مقيد إلى حد مانظام β \beta β الصغير : عندما يكون β ∈ ( 0 , 1 ) \beta \in (0,1) β ∈ ( 0 , 1 ) ، يتدهور معدل التقارب، مما يتطلب افتراضات إضافية للتحسينالخوارزميات البحتة التكيفية : لا تزال هناك حاجة إلى مزيد من البحث لحالة β = 0 \beta = 0 β = 0 البحتة التكيفيةإضعاف افتراضات الاتساق : قد يكون من الممكن تخفيف الافتراض 3.1 في إطار خوارزميات التقريب العشوائيالتوسع إلى التكيف البحت : استخدام تقنيات SV10 للتعامل مع حالة β = 0 \beta = 0 β = 0 تحسين نظام β \beta β الصغير : تطوير تقنيات للتعامل مع β ∈ ( 0 , 1 ) \beta \in (0,1) β ∈ ( 0 , 1 ) دون الحاجة إلى افتراضات إضافيةالعمق النظري : إنشاء نظرية AIR MCMC كاملة في إطار انكماش Wassersteinالابتكار التقني : الاستخدام الماهر لبنية AIR لتبسيط التحكم في الحد المتبقي في تقريب المارتينجيلقابلية التطبيق الواسعة : تغطي إعدادات متعددة مثل الإرجوديكية المنتظمة والهندسية والضعيفة لـ Harrisالقيمة العملية : توفير حدود تقارب المسار، مما له معنى عملي لمحاكاة واحدةتقييد الافتراضات : قد يكون من الصعب التحقق من افتراضات الاتساق في التطبيقات العمليةمعالجة نظام β \beta β الصغير : تتطلب شروط Lipschitz الإضافية وشروط التكيف المتناقصالتحقق الرقمي المحدود : موجهة بشكل أساسي نحو التحليل النظري، مع نقص التجارب الرقمية الكافيةالمساهمة النظرية : توفير أساس نظري متين لـ AIR MCMCالقيمة المنهجية : قد تلهم طريقة انكماش Wasserstein تحليل الخوارزميات الأخرىالآفاق العملية : حدود تقارب المسار لها أهمية كبيرة لتشخيص MCMC ومعايير التوقفالاستدلال الإحصائي عالي الأبعاد : مناسب لأخذ عينات من التوزيعات اللاحقة المعقدةالتوزيعات متعددة الأنماط : معالجة المشاكل متعددة الأنماط من خلال فضاء الحالة المعززالموارد الحسابية المحدودة : تقلل خوارزمية AIR من تكرار التكيف، مما يوفر التكاليف الحسابيةتتضمن الورقة 34 مرجعاً مهماً، تغطي التطورات الرئيسية في نظرية MCMC التكيفية، خاصة:
CLR18 : الاقتراح الأصلي لخوارزمية AIRAM06, SV10 : نظرية MCMC التكيفية الكلاسيكيةHMS11 : الأساس النظري لطريقة انكماش WassersteinPHL20 : طريقة فضاء الحالة المعزز