We define a stochastic variant of the proximal point algorithm in the general setting of nonlinear (separable) Hadamard spaces for approximating zeros of the mean of a stochastically perturbed monotone vector field and prove its convergence under a suitable strong monotonicity assumption, together with a probabilistic independence assumption and a separability assumption on the tangent spaces. As a particular case, our results transfer previous work by P. Bianchi on that method in Hilbert spaces for the first time to Hadamard manifolds. Moreover, our convergence proof is fully effective and allows for the construction of explicit rates of convergence for the iteration towards the (unique) solution both in mean and almost surely. These rates are moreover highly uniform, being independent of most data surrounding the iteration, space or distribution. In that generality, these rates are novel already in the context of Hilbert spaces. Linear nonasymptotic guarantees under additional second-moment conditions on the Yosida approximates and special cases of stochastic convex minimization are discussed.
- معرّف الورقة: 2510.10697
- العنوان: تقارب المتوسط التربيعي والتقارب الخطي لخوارزمية نقطة بروكسيمال عشوائية في فضاءات度القياس ذات الانحناء غير الموجب
- المؤلف: نيكولاس بيشك (جامعة باث)
- التصنيف: math.OC (التحسين والتحكم)، cs.LG (التعلم الآلي)
- تاريخ النشر: 14 أكتوبر 2025 (نسخة arXiv)
- رابط الورقة: https://arxiv.org/abs/2510.10697
تقدم هذه الورقة متغيراً عشوائياً من خوارزمية نقطة بروكسيمال في الإعداد غير الخطي العام لفضاءات هادامار القابلة للفصل، بهدف تقريب الأصفار من متوسط حقول متجهات أحادية الاتجاه المعرضة للاضطرابات العشوائية. تُثبت الورقة تقارب الخوارزمية تحت افتراضات مناسبة للأحادية القوية والاستقلالية الاحتمالية وقابلية فصل الفضاء المماس. كحالة خاصة، يتم تعميم عمل P. Bianchi ذي الصلة في فضاءات هيلبرت إلى متعددات هادامار للمرة الأولى. إثبات التقارب صارم تماماً، مما يسمح ببناء معدلات تقارب صريحة للتكرارات المتقاربة نحو الحل الفريد، بما في ذلك التقارب بالمتوسط والتقارب شبه المؤكد. تتمتع معدلات التقارب هذه بتناسق عالي، مستقل عن معظم بيانات التكرارات والفضاء أو التوزيع.
- المشكلة المراد حلها:
- حل مسائل التحسين العشوائي في فضاءات القياس غير الخطية: minx∈X∫f(ξ,x)dμ(ξ)
- تعميم خوارزمية نقطة بروكسيمال العشوائية من فضاءات هيلبرت إلى فضاءات قياس أكثر عمومية ذات انحناء غير موجب
- أهمية المشكلة:
- التقريب العشوائي هو مشكلة أساسية في التعلم الآلي والتحسين
- التحسين على فضاءات غير خطية له تطبيقات واسعة في التعلم الآلي (مثل تعلم المتعددات)
- النظرية الموجودة محصورة بشكل أساسي في فضاءات هيلبرت، وتفتقر إلى الأساس النظري للفضاءات غير الخطية
- قيود الطرق الموجودة:
- عمل Bianchi ينطبق فقط على فضاءات هيلبرت
- غياب تحليل معدلات التقارب الصريحة
- نظرية خوارزمية نقطة بروكسيمال العشوائية في الفضاءات غير الخطية غير مكتملة
- الدافع البحثي:
- تعميم النظرية الناضجة لفضاءات هيلبرت على فضاءات CAT(0) ومتعددات هادامار
- توفير تحليل معدلات تقارب صريحة ومتسقة
- إنشاء أساس نظري للتحسين العشوائي في الفضاءات غير الخطية
- التعميم النظري: تعميم خوارزمية نقطة بروكسيمال العشوائية من فضاءات هيلبرت إلى فضاءات هادامار القابلة للفصل للمرة الأولى
- تحليل التقارب: إثبات التقارب القوي تحت افتراضات الأحادية القوية، بما في ذلك التقارب بالمتوسط والتقارب شبه المؤكد
- معدلات تقارب صريحة: بناء معدلات تقارب متسقة للغاية، مستقلة عن معظم معاملات التكرار
- الابتكار التقني: تطوير نظرية حقول المتجهات الأحادية العشوائية في فضاءات القياس وتكامل Aumann-Sturm
- توسيع التطبيقات: تغطية فضاءات هيلبرت ومتعددات هادامار كحالات خاصة
بالنظر إلى فضاء احتمالي (E,E,μ) وفضاء هادامار قابل للفصل X، نعتبر حقل متجهات أحادي عشوائي A:E×X→2TX، حيث A(s,x)⊆TxX. الهدف هو إيجاد أصفار المعامل المتوسط Aˉ(x):=∫A(s,x)dμ(s).
خوارزمية نقطة بروكسيمال العشوائية (SPPA):
xn+1:=Jλn(ξn+1,xn)
حيث:
- x0∈X نقطة ابتدائية
- (λn)⊆(0,∞) متتالية معاملات تحقق (λn)∈ℓ+2∖ℓ+1
- (ξn+1) متتالية متغيرات عشوائية مستقلة وموزعة بشكل متطابق بتوزيع μ
- Jλ(s,x):={z∈X∣λ1logzx∈A(s,z)} معامل الحل
- البنية الهندسية لفضاء القياس:
- فضاءات CAT(0): فضاءات قياس جيوديسية كاملة تحقق شروط الانحناء غير الموجب
- الفضاء المماس TxX: يتم بناؤه من خلال زاوية Aleksandrov والمخروط الإقليدي
- شبه الضرب الداخلي: gx(tγ,sη):=tscos∠x(γ,η)
- حقول المتجهات الأحادية:
بالنسبة إلى (x,u),(y,v)∈A، تحقق:
gx(u,logxy)≤−gy(v,logyx)
الأحادية القوية (مع معامل α>0):
gx(u,logxy)≤−gy(v,logyx)−αd2(x,y) - تقريب Yosida:
Aλ(s,x):=λ1logJλ(s,x)x
- نظرية الاحتمالات في فضاءات القياس: استخدام نظرية تكامل Sturm لإنشاء نظرية المتغيرات العشوائية على فضاءات القياس
- تكامل Aumann-Sturm: تعميم تكامل Aumann إلى التطبيقات متعددة القيم على فضاءات القياس
- شبه أحادية Fejér العشوائية: إنشاء متباينتين رئيسيتين للتحكم في السلوك العشوائي للتكرارات
- افتراض الاستقلالية: إدخال الشرط En[gx∗(ϕ∗(ξn+1),logx∗xn)]=0 للتعامل مع الصعوبات التقنية للفضاءات غير الخطية
- (A0) شرط المعاملات: (λn)∈ℓ+2∖ℓ+1، (ξn+1) مستقلة وموزعة بشكل متطابق
- (A1) الأحادية القوية: A(s,⋅) أحادية قوية مع معامل α(s)>0، و ∫αdμ>0
- (A2) وجود الأصفار: يوجد صفر فريد x∗∈ZA(2)
- (A3) الاستقلالية: En[gx∗(ϕ∗(ξn+1),logx∗xn)]=0
النظرية 4.7 (النتيجة الرئيسية للتقارب):
تحت الافتراضات (A0)-(A3)، خوارزمية نقطة بروكسيمال العشوائية تحقق:
- التقارب بالمتوسط: E[d2(xn,x∗)]→0
- التقارب شبه المؤكد: d2(xn,x∗)→0 a.s.
- معدل التقارب الصريح:
∀ε>0,∀n≥ρ(ε):E[d2(xn,x∗)]<ε
حيث ρ(ε):=θ(χ(ε/2c),2D/ε)
النظرية 4.11 (معدل التقارب السريع):
تحت افتراض إضافي للعزم الثاني المحدود (A4)، مع λn=1/[α(n+2)]:
E[d2(xn,x∗)]≤n+2u
النتيجة 4.10: بالنسبة إلى دالة متكاملة محدبة بقوة F(x):=∫f(s,x)dτ(s)، الخوارزمية xn+1:=proxλnf(ξn+1,xn) تتقارب إلى نقطة التقليل من F.
- فضاءات هيلبرت: كحالة خاصة، استرجاع النتيجة الأصلية لـ Bianchi مع توفير معدلات تقارب جديدة
- متعددات هادامار: إنشاء نظرية خوارزمية نقطة بروكسيمال العشوائية في هذا الإعداد للمرة الأولى
- فضاءات CAT(0) الأخرى: مثل فضاءات الأشجار وبعض الرسوم البيانية المترية
اللمة 4.1 (شبه أحادية Fejér العشوائية I):
En[d2(xn+1,x∗)]≤d2(xn,x∗)−λn2(1−2β)En[∥Aλn(ξn+1,xn)∥xn+12]+2βλn2∫∥ϕ∗∥x∗2dμ
اللمة 4.3 (شبه أحادية Fejér العشوائية II):
En[d2(xn+1,x∗)]≤(1+2λn2)d2(xn,x∗)−2λnαd2(xn,x∗)+λn2Vn
- استخدام الخصائص الهندسية لشبه الضرب الداخلي Berg-Nikolaev
- تطبيق الأحادية القوية وخصائص الانحناء غير الموجب لفضاءات CAT(0)
- بناء فوق-مارتينجيل وتطبيق عدم المساواة Ville
- استخدام نسخة كمية من لمة Robbins-Siegmund
- Bianchi (2016): خوارزمية نقطة بروكسيمال العشوائية في فضاءات هيلبرت
- Li, López, Martín-Márquez (2009): خوارزمية نقطة بروكسيمال الحتمية على متعددات هادامار
- Bačák (2013, 2018): خوارزمية نقطة بروكسيمال والتقليل المحدب العشوائي في فضاءات CAT(0)
- Chaipunya, Kohsaka, Kumam (2021): نظرية حقول المتجهات الأحادية في فضاءات CAT(0)
- تعميم ناجح لخوارزمية نقطة بروكسيمال العشوائية إلى فضاءات القياس ذات الانحناء غير الموجب
- إثبات التقارب القوي تحت افتراضات الأحادية القوية
- توفير معدلات تقارب صريحة ومتسقة للغاية
- إنشاء أساس نظري للتحسين العشوائي في الفضاءات غير الخطية
- يتطلب افتراض قابلية فصل الفضاء المماس، وهو صعب التحقق في فضاءات CAT(0) العامة
- افتراض الاستقلالية (A3) يحد من نطاق التطبيق، ينطبق بشكل أساسي على الفضاءات المماسة ذات الانحناء المسطح
- معدل التقارب في الحالة العامة أسي، أبطأ نسبياً
- يتطلب افتراض الأحادية القوية، مما يستبعد العديد من التطبيقات العملية
- دراسة نتائج التقارب الضعيف، تخفيف افتراضات الأحادية القوية
- تعميم معدلات التقارب السريع على إعدادات أكثر عمومية
- دراسة خوارزميات التحسين العشوائي الأخرى على فضاءات غير خطية
- استكشاف التطبيقات العملية، مثل مسائل التعلم الآلي على المتعددات
- الابتكار النظري: تعميم منهجي لأول مرة لخوارزمية نقطة بروكسيمال العشوائية إلى الفضاءات غير الخطية
- العمق التقني: دمج ماهر للهندسة المترية ونظرية الاحتمالات ونظرية التحسين
- اكتمال النتائج: توفير تحليل تقارب نوعي وكمي
- عمومية الطريقة: ينطبق على عدة فضاءات هندسية مهمة
- قيود الافتراضات: افتراضات الاستقلالية وقابلية الفصل تحد من نطاق التطبيق
- سرعة التقارب: معدل التقارب في الحالة العامة بطيء نسبياً
- غياب التحقق التجريبي: نقص التجارب العددية للتحقق من النتائج النظرية
- القابلية العملية: قوية من الناحية النظرية، لكن التطبيقات العملية تحتاج إلى مزيد من التطوير
- القيمة الأكاديمية: توفير أساس نظري مهم للتحسين العشوائي في الفضاءات غير الخطية
- المساهمة المنهجية: توضيح كيفية تعميم نظرية التحسين للفضاءات الخطية إلى الإعدادات غير الخطية
- البحث اللاحق: وضع الأساس للبحث الإضافي في المجالات ذات الصلة
- مسائل التحسين على متعددات هادامار
- الاستدلال الإحصائي في فضاءات الأشجار
- خوارزميات التعلم الآلي في فضاءات ذات انحناء غير موجب
- الإحصاء الهندسي وتحليل الأشكال
تستشهد هذه الورقة بـ 64 مرجعاً ذا صلة، تشمل بشكل أساسي:
- الأدبيات الأساسية لنظرية فضاءات CAT(0) (Bridger & Haefliger, 1999)
- الأعمال الرائدة في نظرية الاحتمالات على فضاءات القياس (Sturm, 2002, 2003)
- الأدبيات الكلاسيكية لنظرية المعاملات الأحادية (Bauschke & Combettes, 2017)
- الأبحاث ذات الصلة في خوارزميات التحسين العشوائي
تتمتع هذه الورقة بأهمية نظرية كبيرة، حيث توفر أساساً رياضياً صارماً للتحسين العشوائي في الفضاءات غير الخطية، لكن لا يزال هناك حاجة إلى مزيد من التطوير في جوانب التطبيق العملي.