An Augmented Lagrangian Value Function Method for Lower-level Constrained Stochastic Bilevel Optimization
Nie, Li, Wen
Recently, lower-level constrained bilevel optimization has attracted increasing attention. However, existing methods mostly focus on either deterministic cases or problems with linear constraints. The main challenge in stochastic cases with general constraints is the bias and variance of the hyper-gradient, arising from the inexact solution of the lower-level problem. In this paper, we propose a novel stochastic augmented Lagrangian value function method for solving stochastic bilevel optimization problems with nonlinear lower-level constraints. Our approach reformulates the original bilevel problem using an augmented Lagrangian-based value function and then applies a penalized stochastic gradient method that carefully manages the noise from stochastic oracles. We establish an equivalence between the stochastic single-level reformulation and the original constrained bilevel problem and provide a non-asymptotic rate of convergence for the proposed method. The rate is further enhanced by employing variance reduction techniques. Extensive experiments on synthetic problems and real-world applications demonstrate the effectiveness of our approach.
academic
طريقة دالة القيمة لاغرانج المعززة للتحسين ثنائي المستوى العشوائي مع قيود المستوى الأدنى
تقدم هذه الورقة طريقة جديدة لاغرانج معززة عشوائية لدالة القيمة لمعالجة مشاكل التحسين ثنائي المستوى العشوائي مع قيود غير خطية في المستوى الأدنى. تعيد الطريقة صياغة المشكلة ثنائي المستوى الأصلية من خلال دالة القيمة لاغرانج المعززة، وتطبق طريقة التدرج العشوائي المعاقب لإدارة الضوضاء من الأوراكل العشوائي بعناية. يثبت المؤلفون التكافؤ بين إعادة البناء أحادي المستوى العشوائي والمشكلة ثنائي المستوى المقيدة الأصلية، ويقدمون تحليل معدل التقارب غير المقارب. تحسن تقنيات تقليل التباين معدل التقارب بشكل إضافي. تتحقق التجارب الشاملة على المشاكل الاصطناعية والتطبيقات الحقيقية من فعالية الطريقة.
خلفية المشكلة: يظهر التحسين ثنائي المستوى مع قيود المستوى الأدنى (LC-BLO) على نطاق واسع في مجال التعلم الآلي، بما في ذلك تحسين المعاملات الفائقة والتعلم الفوقي والتعلم المعزز. تتميز هذه المشاكل ببنية هرمية، حيث يعتمد حل المستوى الأعلى على الحل الأمثل لمشكلة التحسين المقيدة في المستوى الأدنى.
قيود الطرق الموجودة:
تركز معظم الطرق الموجودة على الحالات الحتمية أو مشاكل القيود الخطية
تفتقر المشاكل غير الخطية المقيدة في الحالة العشوائية إلى حلول فعالة
يكمن التحدي الرئيسي في انحياز التدرج الفائق وتباينه الناجم عن الحل غير الدقيق للمشكلة الأدنى
التحديات التقنية:
عدم سلاسة دالة الهدف الفائقة
انحياز التدرج الفائق الناجم عن الحل غير الدقيق للمشكلة الأدنى
إدارة الضوضاء من الأوراكل العشوائي
الدافع البحثي: سد الفجوة في النظرية والخوارزميات للتحسين ثنائي المستوى غير الخطي المقيد العشوائي، وتوفير خوارزميات فعالة مع ضمانات نظرية للتطبيقات العملية في التعلم الآلي.
طريقة إعادة البناء المبتكرة: تقترح إعادة صياغة المشكلة ثنائي المستوى بناءً على دالة لاغرانج المعززة العشوائية وغلافها Moreau، مما يعالج بفعالية الضوضاء الناجمة عن الحل غير الدقيق للمشكلة الأدنى
التكافؤ النظري: تثبت التكافؤ بين إعادة البناء أحادي المستوى العشوائي والمشكلة ثنائي المستوى الأصلية، مما يوفر طريقة عملية وذات أساس نظري متين
أول تحليل تقارب: توفر أول تحليل تقارب لطريقة دالة القيمة في إعدادات عشوائية لـ LC-BLO غير الخطية، مما يثبت تعقيد العينة Õ(cε⁻²)، Õ(cc₁²ε⁻²)
تحسين تقليل التباين: تحسن تعقيد العينة للمتغيرات في المستوى الأعلى إلى Õ(c^1.5ε⁻^1.5) من خلال تقنيات تقليل التباين
المشاكل الاصطناعية: يتقارب كل من SALVF و SALVF-VR بالقرب من الحل الأمثل العام، مع توزيع أكثر تركيزاً لـ SALVF-VR، مما يتحقق من تأثير التسريع لتقليل التباين
تحسين معاملات SVM الفائقة:
يتفوق SALVF على جميع الطرق الأساسية من حيث دقة الاختبار
على الرغم من أن BLOCC يمكنه أيضاً الوصول إلى دقة ذروة مماثلة، إلا أن SALVF أكثر كفاءة في الوقت من حيث التكرار
يحقق حوالي 80% دقة اختبار على مجموعة بيانات Diabetes، وحوالي 75% على مجموعة بيانات Fourclass
ضبط تسوس الوزن:
تتفوق جميع طرق التحسين ثنائي المستوى على الخط الأساسي بدون تسوس وزن، مما يقلل بفعالية الإفراط في التدريب
يحقق SALVF الكفاءة الزمنية الأمثل، بفضل بساطة عملية التكرار ثنائية الحلقة
تستشهد الورقة بـ 49 مرجعاً ذا صلة، تشمل بشكل أساسي:
الأعمال الكلاسيكية والتطورات الحديثة في التحسين ثنائي المستوى
الأساس النظري لطرق لاغرانج المعززة
تقنيات التحسين العشوائي وتقليل التباين
حالات التطبيق في التعلم الآلي
التقييم الشامل: هذه ورقة عالية الجودة تجمع بين النظرية والتطبيق، محققة تقدماً جوهرياً في مشكلة مهمة لكن صعبة، مما يساهم بشكل كبير في مجال التحسين ثنائي المستوى المقيد العشوائي. الطريقة مبتكرة، والنظرية صارمة، والتجارب شاملة، مع قيمة أكاديمية وآفاق عملية جيدة جداً.