2025-11-10T02:58:56.248145

Linear Convergence of a Unified Primal--Dual Algorithm for Convex--Concave Saddle Point Problems with Quadratic Growth

Melcher, Jalilzadeh, Hamedani
In this paper, we study saddle point (SP) problems, focusing on convex-concave optimization involving functions that satisfy either two-sided quadratic functional growth (QFG) or two-sided quadratic gradient growth (QGG)--novel conditions tailored specifically for SP problems as extensions of quadratic growth conditions in minimization. These conditions relax the traditional requirement of strong convexity-strong concavity, thereby encompassing a broader class of problems. We propose a generalized accelerated primal-dual (GAPD) algorithm to solve SP problems with non-bilinear objective functions, unifying and extending existing methods. We prove that our method achieves a linear convergence rate under these relaxed conditions. Additionally, we provide examples of structured SP problems that satisfy either two-sided QFG or QGG, demonstrating the practical applicability and relevance of our approach.
academic

التقارب الخطي لخوارزمية أولية-ثنائية موحدة لمسائل نقطة السرج المحدبة-المقعرة مع النمو التربيعي

المعلومات الأساسية

  • معرّف الورقة: 2510.11990
  • العنوان: التقارب الخطي لخوارزمية أولية-ثنائية موحدة لمسائل نقطة السرج المحدبة-المقعرة مع النمو التربيعي
  • المؤلفون: Cody Melcher (جامعة أريزونا)، Afrooz Jalilzadeh (جامعة أريزونا)، Erfan Yazdandoost Hamedani (جامعة أريزونا)
  • التصنيف: math.OC (التحسين والتحكم)
  • تاريخ النشر: 13 أكتوبر 2025 (نسخة arXiv المسبقة)
  • رابط الورقة: https://arxiv.org/abs/2510.11990

الملخص

تدرس هذه الورقة مسائل نقطة السرج (SP)، مع التركيز على مسائل التحسين المحدبة-المقعرة التي تحقق شروط النمو التربيعي ثنائي الجانب (QFG) أو النمو التربيعي للتدرج ثنائي الجانب (QGG). هذه الشروط جديدة وموضوعة خصيصاً لمسائل نقطة السرج، وتمثل امتداداً لشروط النمو التربيعي في مسائل التقليل. تخفف هذه الشروط من متطلبات التحدب القوي-التقعر القوي التقليدية، مما يشمل فئة أوسع من المسائل. يقترح المؤلفون خوارزمية التدرج المسرّع الموحد الأولي-الثنائي (GAPD) لحل مسائل نقطة السرج ذات الدوال الهدف غير ثنائية الخطية، مما يوحد ويوسع الطرق الموجودة. يثبتون أن الطريقة تحقق معدل تقارب خطي تحت هذه الشروط المخففة. علاوة على ذلك، يقدمون أمثلة على مسائل نقطة السرج المنظمة التي تحقق QFG أو QGG ثنائي الجانب، مما يوضح الملاءمة العملية والأهمية النسبية للطريقة.

الخلفية البحثية والدافع

تعريف المسألة

تدرس هذه الورقة مسألة نقطة السرج التالية: minxXmaxyYf(x,y)\min_{x \in X} \max_{y \in Y} f(x,y) حيث f:X×YRf: X \times Y \rightarrow \mathbb{R} محدبة بالنسبة إلى xx لأي yYy \in Y، ومقعرة بالنسبة إلى yy لأي xXx \in X، وXXX \subseteq \mathcal{X} وYYY \subseteq \mathcal{Y} مجموعات مغلقة محدبة.

دافع البحث

  1. قيود الطرق التقليدية: نتائج التقارب الخطي الموجودة لمسائل نقطة السرج تتطلب عادة شروط التحدب القوي-التقعر القوي، وهو أمر صارم جداً في العديد من التطبيقات العملية.
  2. الانتشار الواسع للتطبيقات: لمسائل نقطة السرج تطبيقات مهمة في نظرية اللعبة والتعلم الموثوق من التوزيع والشبكات العدائية التوليدية وغيرها.
  3. الفجوة النظرية: بينما ثبت أن شروط النمو التربيعي (QFG و QGG) في مسائل التقليل تضمن التقارب الخطي، فإن توسيع هذه الشروط إلى مسائل نقطة السرج يمثل تحدياً غير تافه وظل إلى حد كبير غير مستكشف.
  4. توحيد الطرق: الطرق الأولية-الثنائية الموجودة مثل APD و OGDA تفتقر إلى إطار تحليلي موحد.

المساهمات الأساسية

  1. اقتراح شروط النمو ثنائي الجانب: توسيع شروط QFG و QGG إلى مسائل نقطة السرج للمرة الأولى، مع تعريف شروط النمو التربيعي للدالة ثنائي الجانب والنمو التربيعي للتدرج ثنائي الجانب.
  2. إطار خوارزمي موحد: اقتراح خوارزمية التدرج المسرّع الموحد الأولي-الثنائي (GAPD)، التي توحد طرق APD و OGDA الموجودة.
  3. ضمان التقارب الخطي: إثبات أن خوارزمية GAPD تحقق معدل تقارب خطي تحت شروط QFG أو QGG ثنائي الجانب.
  4. توسيع مسافة Bregman: توسيع إطار التحليل إلى مسافة Bregman، مما يعزز المرونة والتطبيقية للطريقة.
  5. فئات المسائل المنظمة: توفير أمثلة محددة على مسائل نقطة السرج المنظمة التي تحقق شروط النمو ثنائي الجانب.

شرح الطريقة

تعريف المهمة

دراسة مسائل التحسين المحدبة-المقعرة لنقطة السرج، حيث تحقق الدالة الهدف شروط النمو التربيعي ثنائي الجانب بدلاً من شروط التحدب القوي-التقعر القوي التقليدية.

التعاريف الأساسية

النمو التربيعي للتدرج ثنائي الجانب (Two-Sided QGG)

بالنسبة لمسألة نقطة السرج، إذا كانت هناك ثوابت (μx,μy)R++2(μ_x, μ_y) \in \mathbb{R}_{++}^2 بحيث لأي xXx \in X وyYy \in Y: F(z)F(zˉ),zzˉ2DZM(z,zˉ)\langle F(z) - F(\bar{z}), z - \bar{z} \rangle \geq 2D_Z^M(z, \bar{z}) حيث z=[xT,yT]Tz = [x^T, y^T]^T، zˉ=PZ(z)\bar{z} = P_{Z^*}(z)، F(z)=[xf(x,y)T,yf(x,y)T]TF(z) = [\nabla_x f(x,y)^T, -\nabla_y f(x,y)^T]^T، M=diag({μxIn,μyIm})M = \text{diag}(\{μ_x I_n, μ_y I_m\}).

النمو التربيعي للدالة ثنائي الجانب (Two-Sided QFG)

إذا كانت هناك ثوابت (μx,μy)R++2(μ_x, μ_y) \in \mathbb{R}_{++}^2 بحيث: f(x,yˉ)f(xˉ,y)DZM(z,zˉ)f(x, \bar{y}) - f(\bar{x}, y) \geq D_Z^M(z, \bar{z})

معمارية خوارزمية GAPD

قواعد التحديث الأساسية للخوارزمية هي:

  1. حساب حد الزخم:
    • qky=yf(xk,yk)yf(xk1,yk1)q_k^y = \nabla_y f(x_k, y_k) - \nabla_y f(x_{k-1}, y_{k-1})
    • qkx=xf(xk,yk)xf(xk1,yk1)q_k^x = \nabla_x f(x_k, y_k) - \nabla_x f(x_{k-1}, y_{k-1})
  2. تحديث المتغير الثنائي: yk+1=argminyY{yf(xk,yk)+αkqky,y+1σkDY(y,yk)}y_{k+1} = \arg\min_{y \in Y} \left\{-\langle \nabla_y f(x_k, y_k) + α_k q_k^y, y \rangle + \frac{1}{σ_k} D_Y(y, y_k) \right\}
  3. بناء التدرج المجمع: sk=θkxf(xk,yk+1)+(1θk)xf(xk,yk)+βkqkxs_k = θ_k \nabla_x f(x_k, y_{k+1}) + (1-θ_k) \nabla_x f(x_k, y_k) + β_k q_k^x
  4. تحديث المتغير الأولي: xk+1=argminxX{sk,x+1τkDX(x,xk)}x_{k+1} = \arg\min_{x \in X} \left\{ \langle s_k, x \rangle + \frac{1}{τ_k} D_X(x, x_k) \right\}

نقاط الابتكار التقني

  1. التوحيد: توحيد الطرق الموجودة من خلال المعامل θkθ_k:
    • θk=0θ_k = 0: تتحول إلى OGDA
    • θk=1,βk=0θ_k = 1, β_k = 0: تتحول إلى APD
  2. مسافة Bregman: استخدام مسافة Bregman بدلاً من المسافة الإقليدية، مما يوفر مرونة أكبر.
  3. الشروط ثنائية الجانب: توسيع شروط النمو أحادية الجانب إلى نسخة ثنائية الجانب لمسائل نقطة السرج للمرة الأولى.

التحليل النظري

النظرية الرئيسية للتقارب

النظرية 4.4: لتكن {(xk,yk)}k0\{(x_k, y_k)\}_{k≥0} السلسلة المولدة بواسطة الخوارزمية 1. بافتراض أن الافتراضات 2.1-4.3 صحيحة، فإنه لأي K1K ≥ 1 وΓ0Γ \succ 0: DZAKΓBK(zˉK,zK)t0tKDZA0(zˉ0,z0)D_Z^{A_K - Γ B_K}(\bar{z}_K, z_K) ≤ \frac{t_0}{t_K} D_Z^{A_0}(\bar{z}_0, z_0)

معدل التقارب الخطي

النتيجة 4.5: مع اختيار المعاملات المناسب، تتقارب السلسلة التكرارية بمعدل خطي إلى مجموعة الحلول المثلى: DZ(zˉK,zK)DZRK(zˉ0,z0)D_Z(\bar{z}_K, z_K) ≤ D_Z^{R_K}(\bar{z}_0, z_0) حيث RK=αK+1(1α)cMR_K = \frac{α^{K+1}}{(1-α)c_M}، ويعتمد معدل التقارب على المعامل ς>0ς > 0 (عند QFG يكون ς=θς = θ، وعند QGG يكون ς=2(1θ)ς = 2(1-θ)).

فئات المسائل المنظمة

فئات المسائل

النظر في مسألة نقطة السرج المحدبة-المقعرة المنظمة التالية: minxXmaxyYh(C1x)+Ax,yg(C2y)\min_{x \in X} \max_{y \in Y} h(C_1 x) + \langle Ax, y \rangle - g(C_2 y) حيث h:RpRh: \mathbb{R}^p \rightarrow \mathbb{R} وg:RqRg: \mathbb{R}^q \rightarrow \mathbb{R} دوال محدبة قوية.

الشروط الكافية لتحقيق الشروط

القضية 5.1: إذا كانت هناك ثوابت ξ1,ξ2,ξ3,ξ4>0ξ_1, ξ_2, ξ_3, ξ_4 > 0 بحيث:

  • ξ1C1TC1ATAξ_1 C_1^T C_1 \succeq A^T A, ξ2C1TC1λ2GTGξ_2 C_1^T C_1 \succeq \|λ^*\|^2 G^T G
  • ξ3C2TC2AATξ_3 C_2^T C_2 \succeq AA^T, ξ4C2TC2ν2FTFξ_4 C_2^T C_2 \succeq \|ν^*\|^2 F^T F

فإن فئة المسائل هذه تحقق شروط QGG و QFG ثنائي الجانب.

التجارب الرقمية

إعداد التجربة

النظر في مسائل نقطة السرج المولدة عشوائياً: minxRnmaxyRm12C1xb122+Ax,y12C2yb222\min_{x \in \mathbb{R}^n} \max_{y \in \mathbb{R}^m} \frac{1}{2}\|C_1 x - b_1\|_2^2 + \langle Ax, y \rangle - \frac{1}{2}\|C_2 y - b_2\|_2^2

نتائج التجارب

  1. اختبار الأبعاد: إجراء الاختبارات تحت ثلاثة أبعاد مختلفة (n,m,p,q){(75,60,60,50),(150,120,120,100),(300,240,240,200)}(n,m,p,q) \in \{(75,60,60,50), (150,120,120,100), (300,240,240,200)\}.
  2. مقارنة الأداء: تتفوق GAPD على طريقة GDA القياسية عند جميع قيم θθ.
  3. تأثير المعاملات: يحقق θ=0.99θ = 0.99 أفضل أداء، متفوقاً قليلاً على حالة θ=1θ = 1.

الأعمال ذات الصلة

مسائل التقليل

  • لشروط QFG و QGG أهمية كبيرة في إعدادات التحسين الحتمية والعشوائية
  • تركز الأعمال الموجودة بشكل أساسي على التقارب الخطي لمسائل التحسين المحدبة

مسائل نقطة السرج

  • طريقة Arrow-Hurwicz (GDA): تعقيد O(κ2log(1/ε))O(κ^2 \log(1/ε))
  • طريقة التدرج الخارجي (EG): تعقيد O(κlog(1/ε))O(κ \log(1/ε))
  • طريقة التدرج المتفائل (OGDA): تعقيد O(κlog(1/ε))O(κ \log(1/ε))
  • طريقة التدرج المسرّع الأولي-الثنائي (APD): تحقق O(1/ε)O(1/ε) وO(1/ε2)O(1/ε^2) في إعدادات C-C و SC-C على التوالي

عدم المساواة المتغيرة

ترتبط شروط النمو التربيعي ارتباطاً وثيقاً بتحليل حدود الخطأ للمؤثرات الرتيبة والنظامية الفرعية المترية.

الخلاصة والمناقشة

الاستنتاجات الرئيسية

  1. توسيع ناجح لشروط النمو التربيعي إلى مسائل نقطة السرج، مع اقتراح شروط QFG و QGG ثنائي الجانب
  2. تحقيق خوارزمية GAPD تقارباً خطياً تحت الشروط المخففة، مع توحيد الطرق الموجودة
  3. توفير فئات مسائل منظمة تحقق شروط النمو الجديدة

القيود

  1. التحقق من الشروط: قد يكون التحقق من شروط النمو ثنائي الجانب في التطبيقات العملية تحدياً
  2. اختيار المعاملات: يتطلب اختيار المعامل الأمثل θθ معرفة خاصة بالمسألة
  3. معالجة القيود: يركز بشكل أساسي على مجموعات القيود البسيطة، مع معالجة محدودة للقيود المعقدة

الاتجاهات المستقبلية

  1. دراسة السلوك التقاربي تحت شروط النمو التربيعي أحادي الجانب
  2. استكشاف التطبيقات في التحسين الموزع
  3. التوسيع إلى مسائل التحسين ذات القيود الأكثر تعقيداً

التقييم المتعمق

المزايا

  1. الابتكار النظري: توسيع منهجي لشروط النمو التربيعي إلى مسائل نقطة السرج للمرة الأولى، ملء فجوة نظرية مهمة
  2. إطار موحد: توحيد خوارزمية GAPD بشكل أنيق لعدة طرق موجودة
  3. القيمة العملية: تخفيف الشروط يجعل الطريقة قابلة للتطبيق على فئة أوسع من المسائل
  4. التحليل الدقيق: توفير تحليل تقارب كامل ومعدلات تقارب محددة

أوجه القصور

  1. التجارب المحدودة: التجارب الرقمية نسبياً بسيطة، تفتقر إلى التحقق في سيناريوهات التطبيق الفعلي
  2. تحليل العلاقات: يمكن أن يكون تحليل العلاقة بين شروط QFG و QGG ثنائي الجانب أعمق
  3. التعقيد الحسابي: لم يتم تحليل التعقيد الحسابي لكل تكرار بالتفصيل

التأثير

  1. المساهمة الأكاديمية: توفير أدوات نظرية مهمة لنظرية تحسين نقطة السرج
  2. القيمة العملية: توحيد الطريقة ومرونتها تجعلها ذات إمكانات في عدة مجالات تطبيقية
  3. القابلية للتوسع: توفير أساس نظري متين للبحث اللاحق

السيناريوهات القابلة للتطبيق

  1. التدريب العدائي في التعلم الآلي
  2. التحسين الموثوق من التوزيع
  3. تطبيقات نظرية اللعبة
  4. مسائل التحسين المحدبة ذات البنية الخاصة

المراجع

تستشهد الورقة بـ 46 مرجعاً ذا صلة، تغطي مجالات متعددة بما فيها تحسين نقطة السرج وعدم المساواة المتغيرة وشروط النمو التربيعي وغيرها، مما يوفر أساساً نظرياً متيناً لهذا البحث.