Fast and Interpretable Mixed-Integer Linear Program Solving by Learning Model Reduction
Li, Chen, Li et al.
By exploiting the correlation between the structure and the solution of Mixed-Integer Linear Programming (MILP), Machine Learning (ML) has become a promising method for solving large-scale MILP problems. Existing ML-based MILP solvers mainly focus on end-to-end solution learning, which suffers from the scalability issue due to the high dimensionality of the solution space. Instead of directly learning the optimal solution, this paper aims to learn a reduced and equivalent model of the original MILP as an intermediate step. The reduced model often corresponds to interpretable operations and is much simpler, enabling us to solve large-scale MILP problems much faster than existing commercial solvers. However, current approaches rely only on the optimal reduced model, overlooking the significant preference information of all reduced models. To address this issue, this paper proposes a preference-based model reduction learning method, which considers the relative performance (i.e., objective cost and constraint feasibility) of all reduced models on each MILP instance as preferences. We also introduce an attention mechanism to capture and represent preference information, which helps improve the performance of model reduction learning tasks. Moreover, we propose a SetCover based pruning method to control the number of reduced models (i.e., labels), thereby simplifying the learning process. Evaluation on real-world MILP problems shows that 1) compared to the state-of-the-art model reduction ML methods, our method obtains nearly 20% improvement on solution accuracy, and 2) compared to the commercial solver Gurobi, two to four orders of magnitude speedups are achieved.
academic
حل برامج البرمجة الخطية المختلطة بالأعداد الصحيحة بسرعة وقابلية تفسير من خلال تعلم تقليل النموذج
تقترح هذه الورقة طريقة قائمة على التعلم الآلي لحل برامج البرمجة الخطية المختلطة بالأعداد الصحيحة (MILP) على نطاق واسع من خلال الاستفادة من الارتباط بين هيكل MILP وحله. بخلاف الطرق الحالية للتعلم من النهاية إلى النهاية، تتعلم هذه الورقة نموذجاً مختزلاً معادلاً من MILP الأصلي كخطوة وسيطة. تقدم الطريقة أسلوب تعلم تقليل نموذج قائم على التفضيل، مع الأخذ في الاعتبار الأداء النسبي لجميع النماذج المختزلة على كل مثيل MILP كمعلومات تفضيل، وتدخل آلية الانتباه لالتقاط معلومات التفضيل. تُظهر النتائج التجريبية تحسناً بنسبة تقارب 20% في دقة الحل مقارنة بأحدث طرق تقليل النموذج القائمة على التعلم الآلي، وتحقق تسريعاً بمعامل 2-4 أوامر من حيث الحجم مقارنة بحل Gurobi التجاري.
تطبيقات برامج البرمجة الخطية المختلطة بالأعداد الصحيحة (MILP) واسعة الانتشار في المجالات الحرجة مثل الخدمات اللوجستية لسلسلة التوريد وجدولة الخدمات وإدارة الطاقة والتخطيط النقلي. في التطبيقات الصناعية العملية، تتضمن مثيلات MILP عادة عشرات الآلاف من متغيرات القرار والقيود. تستند الحلول التجارية الحالية إلى طرق الحل الدقيقة، مما يؤدي إلى تكاليف حسابية عالية ولا يمكنها تلبية المتطلبات في الوقت الفعلي.
اقتراح طريقة تعلم تقليل نموذج قائمة على التفضيل: تحويل أداء النموذج المختزل إلى معلومات تفضيل، مع الاستفادة الكاملة من معلومات المقارنة في فضاء المثيل-الاستراتيجية
تصميم معمارية آلية انتباه: التقاط الارتباط بين المثيل والنماذج المختزلة المفضلة، مما يحسن دقة التعلم
إدخال تقنية تقليم SETCOVER: التحكم في عدد النماذج المختزلة (التسميات)، وإنشاء مجموعة تسميات دنيا قابلة للتطبيق على جميع المثيلات
تحقيق تحسن أداء كبير: التحقق على مشاكل MILP الحقيقية، مع تحسن في الدقة بنسبة 20% مقارنة بالطرق الموجودة، وتسريع بمعامل 2-4 أوامر من حيث الحجم مقارنة بـ Gurobi
الاستفادة من خاصية التعدي للتفضيل، ترتيب الاستراتيجيات حسب التفضيل، يتطلب فقط M_P عينة تفضيل مرتبة بدلاً من (M_P choose 2) مقارنة مزدوجة، مما يقلل تعقيد العينة من تربيعي إلى خطي.
على مجموعة بيانات خلايا الوقود، تحقق طريقة التفضيل تحسناً في الدقة بمتوسط حوالي 9% مقارنة بملاءمة المكافأة المباشرة، مع أداء أفضل في مؤشرات عدم الجدوى والدون الأمثلية.
تستشهد الورقة بأعمال مهمة في هذا المجال، بما في ذلك:
Bengio, Lodi, and Prouvost (2021): مسح التعلم الآلي للتحسين التوافقي
Bertsimas and Stellato (2022): التحسين المختلط بالأعداد الصحيحة عبر الإنترنت
Misra, Roald, and Ng (2022): التعلم للتحسين المقيد
وعدد كبير من أعمال التعلم من النهاية إلى النهاية وطرق التعلم للتحسين ذات الصلة
التقييم الإجمالي: هذه ورقة بحثية عالية الجودة تقترح طريقة ابتكارية لتعلم التفضيل في مجال ML4CO. على الرغم من وجود بعض القيود، فإن مساهماتها النظرية والعملية بارزة جداً، مما يوفر مساراً فعالاً جديداً لحل MILP واسع النطاق.