Revisit First-order Methods for Geodesically Convex Optimization
Shu, Jiang, Shi et al.
In a seminal work of Zhang and Sra, gradient descent methods for geodesically convex optimization were comprehensively studied. In particular, Zhang and Sra derived a comparison inequality that relates the iterative points in the optimization process. Since their seminal work, numerous follow-ups have studied different downstream usages of their comparison lemma.
In this work, we introduce the concept of quasilinearization to optimization, presenting a novel framework for analyzing geodesically convex optimization. By leveraging this technique, we establish state-of-the-art convergence rates -- for both deterministic and stochastic settings -- under weaker assumptions than previously required. The technique of quasilinearization may prove valuable for other non-Euclidean optimization problems.
academic
إعادة النظر في طرق الرتبة الأولى للتحسين الجيوديسي المحدب
تعيد هذه الورقة النظر في طرق الرتبة الأولى في التحسين الجيوديسي المحدب. درس تشانج وسرا في عملهما الرائد بشكل شامل طرق الانحدار التدريجي للتحسين الجيوديسي المحدب، وخاصة اشتقاق متباينات المقارنة المتعلقة بنقاط التكرار في عملية التحسين. تقدم هذه الورقة مفهوم شبه التخطيط الخطي (quasilinearization) إلى مجال التحسين، وتقترح إطار عمل جديد لتحليل التحسين الجيوديسي المحدب. من خلال الاستفادة من هذه التقنية، تُرسي معدلات تقارب متقدمة للإعدادات الحتمية والعشوائية تحت افتراضات أضعف من السابق. قد تكون تقنية شبه التخطيط الخطي ذات قيمة لمشاكل التحسين غير الإقليدية الأخرى.
النظرية 1 (الحالة الحتمية): لتكن f دالة جيوديسية محدبة على متشعب هادامار M، خوارزمية التدرج القريب تستوفي:
f(xt)−f(x∗)≤ηt∣x0x∗∣2
النظرية 2 (الحالة العشوائية): تحت افتراض التباين المحدود، خوارزمية التدرج القريب العشوائي مع حجم الخطوة ηt=2Lt1 تستوفي:
∑t=1Tαt1∑t=1Tαt(EF(xt)−F(x∗))≤2∑t=1Tαt∣x0x∗∣2+∑t=1Tαtσ2log(T+1)
بونابيل (2013): الانحدار التدريجي العشوائي على متشعبات ريمان
عدة أعمال حديثة حول تحسين متشعبات هادامار
التقييم الإجمالي: هذه ورقة نظرية عالية الجودة، حيث تحل بنجاح مشكلة مفتوحة مهمة في مجال التحسين الجيوديسي المحدب من خلال إدخال تقنية شبه التخطيط الخطي. على الرغم من نقص التجارب العددية، فإن مساهماتها النظرية كبيرة، وتوفر إطار عمل وأدوات تحليل جديدة للتحسين غير الإقليدي.