Convergence of two-timescale gradient descent ascent dynamics: finite-dimensional and mean-field perspectives
An, Lu
The two-timescale gradient descent-ascent (GDA) is a canonical gradient algorithm designed to find Nash equilibria in min-max games. We analyze the two-timescale GDA by investigating the effects of learning rate ratios on convergence behavior in both finite-dimensional and mean-field settings. In particular, for finite-dimensional quadratic min-max games, we obtain long-time convergence in near quasi-static regimes through the hypocoercivity method. For mean-field GDA dynamics, we investigate convergence under a finite-scale ratio using a mixed synchronous-reflection coupling technique.
خوارزمية الهبوط التدرجي الصعودي (GDA) ثنائية الجدول الزمني هي خوارزمية تدرجية كلاسيكية للبحث عن توازن ناش في الألعاب الصغرى الكبرى. تحلل هذه الورقة خوارزمية GDA ثنائية الجدول الزمني في الإعدادات المحدودة الأبعاد ومتوسط المجال من خلال دراسة تأثير نسبة معدل التعلم على سلوك التقارب. بالنسبة للألعاب الصغرى الكبرى التربيعية المحدودة الأبعاد، تم الحصول على التقارب طويل الأمد في المنطقة شبه الثابتة تقريباً باستخدام طريقة الإجبار الفرعي. بالنسبة لديناميكيات GDA متوسط المجال، تم دراسة التقارب تحت نسب مقياس محدودة باستخدام تقنية الاقتران المتزامن-الانعكاسي الهجين.
المشكلة الأساسية: مشاكل التحسين الصغرى الكبرى منتشرة على نطاق واسع في التعلم الآلي، مثل الشبكات العدائية التوليدية (GANs)، والتعلم المعزز متعدد الوكلاء، والنقل الأمثل. قد تتقارب خوارزمية الهبوط التدرجي الصعودي القياسية إلى حلقات حدية أو تتباعد في الإعدادات غير المحدبة-غير المقعرة.
الأهمية: أصبحت خوارزمية GDA ثنائية الجدول الزمني، من خلال استخدام معدلات تعلم مختلفة لتحديثات الهبوط والصعود التدرجي، بديلاً شهيراً لحل صعوبات غير المحدبة-غير المقعرة. يعتبر فهم كيفية تأثير نسبة معدل التعلم على سلوك التقارب أمراً حاسماً لتصميم الخوارزمية.
القيود الموجودة:
أفضل نتائج التقارب في الحالة المحدودة الأبعاد تتطلب افتراضات قوية
في حالة متوسط المجال، تقتصر النتائج الموجودة بشكل أساسي على المنطقة شبه الثابتة (η ≫ 1 أو η ≪ 1)
نقص التحليل الكمي لنسبة معدل التعلم η
دافع البحث: الإجابة على السؤال الرئيسي: "كيف تتقارب خوارزمية GDA ثنائية الجدول الزمني وفقاً لنسبة معدل التعلم η؟" وتقديم إجابات كمية للحالات المحدودة الأبعاد واللانهائية الأبعاد.
التحليل المحدود الأبعاد: تحليل ديناميكيات خوارزمية GDA ثنائية الجدول الزمني للألعاب التربيعية باستخدام طريقة الإجبار الفرعي، وبناء دوال Lyapunov لتقدير معدل التقارب الكمي مع نسبة معدل التعلم η.
تصميم المكيفات المسبقة: مناقشة كيفية تصميم مكيفات مسبقة لديناميكيات ثنائية الجدول الزمني لتقليل الحساسية للقيم القصوى لـ η وتحسين التقارب.
تحليل متوسط المجال: دراسة التقارب لمشاكل الصغرى الكبرى المنتظمة بالإنتروبيا باستخدام طريقة الاقتران المتزامن-الانعكاسي الهجين، والتي تنطبق على نطاقات محدودة من قيم η والدوال الهدف غير المحدبة-غير المقعرة محلياً.
معدل التقارب الموحد: الحصول على معدلات تقارب بالشكل min{√η, 1/√η} أو min{1, η} في كلا الإعدادين، مما يشير إلى أن اختيار η الأمثل يجب أن يكون قريباً من 1 وليس في المنطقة شبه الثابتة.
تستشهد الورقة بـ 56 مرجعاً ذا صلة، تغطي أعمالاً مهمة في نظرية التحسين والاحتمالات والمعادلات التفاضلية الجزئية وغيرها من المجالات، مما يوفر أساساً نظرياً متيناً للبحث.