In this paper, we study saddle point (SP) problems, focusing on convex-concave optimization involving functions that satisfy either two-sided quadratic functional growth (QFG) or two-sided quadratic gradient growth (QGG)--novel conditions tailored specifically for SP problems as extensions of quadratic growth conditions in minimization. These conditions relax the traditional requirement of strong convexity-strong concavity, thereby encompassing a broader class of problems. We propose a generalized accelerated primal-dual (GAPD) algorithm to solve SP problems with non-bilinear objective functions, unifying and extending existing methods. We prove that our method achieves a linear convergence rate under these relaxed conditions. Additionally, we provide examples of structured SP problems that satisfy either two-sided QFG or QGG, demonstrating the practical applicability and relevance of our approach.
- معرّف الورقة: 2510.11990
- العنوان: التقارب الخطي لخوارزمية أولية-ثنائية موحدة لمسائل نقطة السرج المحدبة-المقعرة مع النمو التربيعي
- المؤلفون: Cody Melcher (جامعة أريزونا)، Afrooz Jalilzadeh (جامعة أريزونا)، Erfan Yazdandoost Hamedani (جامعة أريزونا)
- التصنيف: math.OC (التحسين والتحكم)
- تاريخ النشر: 13 أكتوبر 2025 (نسخة arXiv المسبقة)
- رابط الورقة: https://arxiv.org/abs/2510.11990
تدرس هذه الورقة مسائل نقطة السرج (SP)، مع التركيز على مسائل التحسين المحدبة-المقعرة التي تحقق شروط النمو التربيعي ثنائي الجانب (QFG) أو النمو التربيعي للتدرج ثنائي الجانب (QGG). هذه الشروط جديدة وموضوعة خصيصاً لمسائل نقطة السرج، وتمثل امتداداً لشروط النمو التربيعي في مسائل التقليل. تخفف هذه الشروط من متطلبات التحدب القوي-التقعر القوي التقليدية، مما يشمل فئة أوسع من المسائل. يقترح المؤلفون خوارزمية التدرج المسرّع الموحد الأولي-الثنائي (GAPD) لحل مسائل نقطة السرج ذات الدوال الهدف غير ثنائية الخطية، مما يوحد ويوسع الطرق الموجودة. يثبتون أن الطريقة تحقق معدل تقارب خطي تحت هذه الشروط المخففة. علاوة على ذلك، يقدمون أمثلة على مسائل نقطة السرج المنظمة التي تحقق QFG أو QGG ثنائي الجانب، مما يوضح الملاءمة العملية والأهمية النسبية للطريقة.
تدرس هذه الورقة مسألة نقطة السرج التالية:
minx∈Xmaxy∈Yf(x,y)
حيث f:X×Y→R محدبة بالنسبة إلى x لأي y∈Y، ومقعرة بالنسبة إلى y لأي x∈X، وX⊆X وY⊆Y مجموعات مغلقة محدبة.
- قيود الطرق التقليدية: نتائج التقارب الخطي الموجودة لمسائل نقطة السرج تتطلب عادة شروط التحدب القوي-التقعر القوي، وهو أمر صارم جداً في العديد من التطبيقات العملية.
- الانتشار الواسع للتطبيقات: لمسائل نقطة السرج تطبيقات مهمة في نظرية اللعبة والتعلم الموثوق من التوزيع والشبكات العدائية التوليدية وغيرها.
- الفجوة النظرية: بينما ثبت أن شروط النمو التربيعي (QFG و QGG) في مسائل التقليل تضمن التقارب الخطي، فإن توسيع هذه الشروط إلى مسائل نقطة السرج يمثل تحدياً غير تافه وظل إلى حد كبير غير مستكشف.
- توحيد الطرق: الطرق الأولية-الثنائية الموجودة مثل APD و OGDA تفتقر إلى إطار تحليلي موحد.
- اقتراح شروط النمو ثنائي الجانب: توسيع شروط QFG و QGG إلى مسائل نقطة السرج للمرة الأولى، مع تعريف شروط النمو التربيعي للدالة ثنائي الجانب والنمو التربيعي للتدرج ثنائي الجانب.
- إطار خوارزمي موحد: اقتراح خوارزمية التدرج المسرّع الموحد الأولي-الثنائي (GAPD)، التي توحد طرق APD و OGDA الموجودة.
- ضمان التقارب الخطي: إثبات أن خوارزمية GAPD تحقق معدل تقارب خطي تحت شروط QFG أو QGG ثنائي الجانب.
- توسيع مسافة Bregman: توسيع إطار التحليل إلى مسافة Bregman، مما يعزز المرونة والتطبيقية للطريقة.
- فئات المسائل المنظمة: توفير أمثلة محددة على مسائل نقطة السرج المنظمة التي تحقق شروط النمو ثنائي الجانب.
دراسة مسائل التحسين المحدبة-المقعرة لنقطة السرج، حيث تحقق الدالة الهدف شروط النمو التربيعي ثنائي الجانب بدلاً من شروط التحدب القوي-التقعر القوي التقليدية.
بالنسبة لمسألة نقطة السرج، إذا كانت هناك ثوابت (μx,μy)∈R++2 بحيث لأي x∈X وy∈Y:
⟨F(z)−F(zˉ),z−zˉ⟩≥2DZM(z,zˉ)
حيث z=[xT,yT]T، zˉ=PZ∗(z)، F(z)=[∇xf(x,y)T,−∇yf(x,y)T]T، M=diag({μxIn,μyIm}).
إذا كانت هناك ثوابت (μx,μy)∈R++2 بحيث:
f(x,yˉ)−f(xˉ,y)≥DZM(z,zˉ)
قواعد التحديث الأساسية للخوارزمية هي:
- حساب حد الزخم:
- qky=∇yf(xk,yk)−∇yf(xk−1,yk−1)
- qkx=∇xf(xk,yk)−∇xf(xk−1,yk−1)
- تحديث المتغير الثنائي:
yk+1=argminy∈Y{−⟨∇yf(xk,yk)+αkqky,y⟩+σk1DY(y,yk)}
- بناء التدرج المجمع:
sk=θk∇xf(xk,yk+1)+(1−θk)∇xf(xk,yk)+βkqkx
- تحديث المتغير الأولي:
xk+1=argminx∈X{⟨sk,x⟩+τk1DX(x,xk)}
- التوحيد: توحيد الطرق الموجودة من خلال المعامل θk:
- θk=0: تتحول إلى OGDA
- θk=1,βk=0: تتحول إلى APD
- مسافة Bregman: استخدام مسافة Bregman بدلاً من المسافة الإقليدية، مما يوفر مرونة أكبر.
- الشروط ثنائية الجانب: توسيع شروط النمو أحادية الجانب إلى نسخة ثنائية الجانب لمسائل نقطة السرج للمرة الأولى.
النظرية 4.4: لتكن {(xk,yk)}k≥0 السلسلة المولدة بواسطة الخوارزمية 1. بافتراض أن الافتراضات 2.1-4.3 صحيحة، فإنه لأي K≥1 وΓ≻0:
DZAK−ΓBK(zˉK,zK)≤tKt0DZA0(zˉ0,z0)
النتيجة 4.5: مع اختيار المعاملات المناسب، تتقارب السلسلة التكرارية بمعدل خطي إلى مجموعة الحلول المثلى:
DZ(zˉK,zK)≤DZRK(zˉ0,z0)
حيث RK=(1−α)cMαK+1، ويعتمد معدل التقارب على المعامل ς>0 (عند QFG يكون ς=θ، وعند QGG يكون ς=2(1−θ)).
النظر في مسألة نقطة السرج المحدبة-المقعرة المنظمة التالية:
minx∈Xmaxy∈Yh(C1x)+⟨Ax,y⟩−g(C2y)
حيث h:Rp→R وg:Rq→R دوال محدبة قوية.
القضية 5.1: إذا كانت هناك ثوابت ξ1,ξ2,ξ3,ξ4>0 بحيث:
- ξ1C1TC1⪰ATA, ξ2C1TC1⪰∥λ∗∥2GTG
- ξ3C2TC2⪰AAT, ξ4C2TC2⪰∥ν∗∥2FTF
فإن فئة المسائل هذه تحقق شروط QGG و QFG ثنائي الجانب.
النظر في مسائل نقطة السرج المولدة عشوائياً:
minx∈Rnmaxy∈Rm21∥C1x−b1∥22+⟨Ax,y⟩−21∥C2y−b2∥22
- اختبار الأبعاد: إجراء الاختبارات تحت ثلاثة أبعاد مختلفة (n,m,p,q)∈{(75,60,60,50),(150,120,120,100),(300,240,240,200)}.
- مقارنة الأداء: تتفوق GAPD على طريقة GDA القياسية عند جميع قيم θ.
- تأثير المعاملات: يحقق θ=0.99 أفضل أداء، متفوقاً قليلاً على حالة θ=1.
- لشروط QFG و QGG أهمية كبيرة في إعدادات التحسين الحتمية والعشوائية
- تركز الأعمال الموجودة بشكل أساسي على التقارب الخطي لمسائل التحسين المحدبة
- طريقة Arrow-Hurwicz (GDA): تعقيد O(κ2log(1/ε))
- طريقة التدرج الخارجي (EG): تعقيد O(κlog(1/ε))
- طريقة التدرج المتفائل (OGDA): تعقيد O(κlog(1/ε))
- طريقة التدرج المسرّع الأولي-الثنائي (APD): تحقق O(1/ε) وO(1/ε2) في إعدادات C-C و SC-C على التوالي
ترتبط شروط النمو التربيعي ارتباطاً وثيقاً بتحليل حدود الخطأ للمؤثرات الرتيبة والنظامية الفرعية المترية.
- توسيع ناجح لشروط النمو التربيعي إلى مسائل نقطة السرج، مع اقتراح شروط QFG و QGG ثنائي الجانب
- تحقيق خوارزمية GAPD تقارباً خطياً تحت الشروط المخففة، مع توحيد الطرق الموجودة
- توفير فئات مسائل منظمة تحقق شروط النمو الجديدة
- التحقق من الشروط: قد يكون التحقق من شروط النمو ثنائي الجانب في التطبيقات العملية تحدياً
- اختيار المعاملات: يتطلب اختيار المعامل الأمثل θ معرفة خاصة بالمسألة
- معالجة القيود: يركز بشكل أساسي على مجموعات القيود البسيطة، مع معالجة محدودة للقيود المعقدة
- دراسة السلوك التقاربي تحت شروط النمو التربيعي أحادي الجانب
- استكشاف التطبيقات في التحسين الموزع
- التوسيع إلى مسائل التحسين ذات القيود الأكثر تعقيداً
- الابتكار النظري: توسيع منهجي لشروط النمو التربيعي إلى مسائل نقطة السرج للمرة الأولى، ملء فجوة نظرية مهمة
- إطار موحد: توحيد خوارزمية GAPD بشكل أنيق لعدة طرق موجودة
- القيمة العملية: تخفيف الشروط يجعل الطريقة قابلة للتطبيق على فئة أوسع من المسائل
- التحليل الدقيق: توفير تحليل تقارب كامل ومعدلات تقارب محددة
- التجارب المحدودة: التجارب الرقمية نسبياً بسيطة، تفتقر إلى التحقق في سيناريوهات التطبيق الفعلي
- تحليل العلاقات: يمكن أن يكون تحليل العلاقة بين شروط QFG و QGG ثنائي الجانب أعمق
- التعقيد الحسابي: لم يتم تحليل التعقيد الحسابي لكل تكرار بالتفصيل
- المساهمة الأكاديمية: توفير أدوات نظرية مهمة لنظرية تحسين نقطة السرج
- القيمة العملية: توحيد الطريقة ومرونتها تجعلها ذات إمكانات في عدة مجالات تطبيقية
- القابلية للتوسع: توفير أساس نظري متين للبحث اللاحق
- التدريب العدائي في التعلم الآلي
- التحسين الموثوق من التوزيع
- تطبيقات نظرية اللعبة
- مسائل التحسين المحدبة ذات البنية الخاصة
تستشهد الورقة بـ 46 مرجعاً ذا صلة، تغطي مجالات متعددة بما فيها تحسين نقطة السرج وعدم المساواة المتغيرة وشروط النمو التربيعي وغيرها، مما يوفر أساساً نظرياً متيناً لهذا البحث.