Fast and Interpretable Mixed-Integer Linear Program Solving by Learning Model Reduction
Li, Chen, Li et al.
By exploiting the correlation between the structure and the solution of Mixed-Integer Linear Programming (MILP), Machine Learning (ML) has become a promising method for solving large-scale MILP problems. Existing ML-based MILP solvers mainly focus on end-to-end solution learning, which suffers from the scalability issue due to the high dimensionality of the solution space. Instead of directly learning the optimal solution, this paper aims to learn a reduced and equivalent model of the original MILP as an intermediate step. The reduced model often corresponds to interpretable operations and is much simpler, enabling us to solve large-scale MILP problems much faster than existing commercial solvers. However, current approaches rely only on the optimal reduced model, overlooking the significant preference information of all reduced models. To address this issue, this paper proposes a preference-based model reduction learning method, which considers the relative performance (i.e., objective cost and constraint feasibility) of all reduced models on each MILP instance as preferences. We also introduce an attention mechanism to capture and represent preference information, which helps improve the performance of model reduction learning tasks. Moreover, we propose a SetCover based pruning method to control the number of reduced models (i.e., labels), thereby simplifying the learning process. Evaluation on real-world MILP problems shows that 1) compared to the state-of-the-art model reduction ML methods, our method obtains nearly 20% improvement on solution accuracy, and 2) compared to the commercial solver Gurobi, two to four orders of magnitude speedups are achieved.
academic
Schnelle und interpretierbare Lösung gemischter ganzzahliger linearer Programme durch Erlernen der Modellreduktion
In diesem Papier wird eine auf maschinellem Lernen basierende Methode zur Lösung großer gemischter ganzzahliger linearer Programme (MILP) vorgestellt, die die Korrelation zwischen MILP-Struktur und Lösungen nutzt. Im Gegensatz zu bestehenden End-to-End-Lernmethoden wird hier ein vereinfachtes äquivalentes Modell des ursprünglichen MILP als Zwischenschritt erlernt. Die Methode führt ein präferenzbasiertes Modellreduktionslernverfahren ein, das die relative Leistung aller reduzierten Modelle auf jeder MILP-Instanz als Präferenzinformation berücksichtigt und einen Aufmerksamkeitsmechanismus einführt, um Präferenzinformationen zu erfassen. Die experimentellen Ergebnisse zeigen, dass die Methode im Vergleich zu fortschrittlichen modellreduktionsbasierten ML-Methoden die Lösungsgenauigkeit um fast 20 % verbessert und im Vergleich zum kommerziellen Solver Gurobi eine Beschleunigung um 2-4 Größenordnungen erreicht.
Gemischte ganzzahlige lineare Programme (MILP) haben breite Anwendungen in kritischen Bereichen wie Lieferkettenlogistik, Serviceplanung, Energiemanagement und Verkehrsplanung. In praktischen Industrieanwendungen umfassen MILP-Instanzen typischerweise Hunderttausende von Entscheidungsvariablen und Nebenbedingungen. Bestehende kommerzielle Solver basieren auf exakten Lösungsmethoden mit hohen Rechenkosten und können Echtzeitanforderungen nicht erfüllen.
Skalierungsprobleme: Bestehende ML-Methoden erlernen direkt hochdimensionale Lösungsraumabbildungen mit Skalierbarkeitsproblemen
Mangel an Interpretierbarkeit: End-to-End-Methoden können keine interpretierbaren Lösungen oder intuitive Verständigung bieten
Unzureichende Nutzung von Präferenzinformationen: Bestehende Modellreduktionsmethoden konzentrieren sich nur auf das optimale reduzierte Modell und ignorieren wichtige Präferenzinformationen aller reduzierten Modelle
End-to-End-Lösungsvorhersage: Aufgrund der Hochdimensionalität des Lösungsraums ist die Vorhersagegenauigkeit niedrig
Lernoptimierung: Begrenzte Effizienz durch Entscheidungshorizont-Einschränkungen
Bestehende Modellreduktionsmethoden: Behandeln durchführbare reduzierte Modelle als gleichwertig ideale Labels und nutzen Vergleichsinformationen nicht vollständig
Präferenzbasierte Modellreduktionslernmethode: Konvertiert die Leistung reduzierter Modelle in Präferenzinformationen und nutzt Vergleichsinformationen im Instanz-Strategie-Raum vollständig
Aufmerksamkeitsmechanismus-Architektur: Erfasst die Korrelation zwischen Instanzen und bevorzugten reduzierten Modellen und verbessert die Lerngenauigkeit
SETCOVER-Beschneidungstechnik: Kontrolliert die Anzahl reduzierter Modelle (Labels) und generiert minimale Label-Sets, die für alle Instanzen durchführbar sind
Signifikante Leistungsverbesserung: Validiert auf echten MILP-Problemen mit 20 % Genauigkeitssteigerung gegenüber bestehenden Methoden und 2-4 Größenordnungen Beschleunigung gegenüber Gurobi
min f(c, x)
s.t. g(A, x) ≤ b
xI ∈ Z^d, x_{-I} ∈ R^{n-d}
wobei θ = ⟨A, c, b⟩ die MILP-Parameter darstellt.
Optimale Strategiedefinition: s*(θ) = (T(θ), x*_I(θ)), einschließlich der Menge enger Nebenbedingungen T(θ) und der Werte ganzzahliger Variablen bei der optimalen Lösung.
Ziel: Erlernen der Abbildung von Parametern θ zur optimalen Strategie s*(θ).
Nutzt die Transitivität von Präferenzen, sortiert Strategien nach Präferenz und benötigt nur M_P geordnete Präferenzproben statt (M_P choose 2) paarweise Vergleiche, wodurch die Stichprobenkomplexität von quadratisch auf linear reduziert wird.
Wählt in der Online-Phase Top-k-Ausgabestrategien als Kandidaten aus, bewertet durch Lösen reduzierter Modelle und wählt die Strategie mit der niedrigsten Undurchführbarkeit.
Auf dem Brennstoffzellen-Datensatz zeigt die Präferenzmethode durchschnittliche Genauigkeitssteigerung von etwa 9 % gegenüber direkter Belohnungsanpassung mit besserer Leistung bei Undurchführbarkeits- und Suboptimalitätsmetriken.
Die Sortiermethode zeigt durchschnittliche Genauigkeitssteigerung von etwa 8 % gegenüber traditionellem Präferenzpaar-Sampling bei verschiedenen Problemgrößen und reduziert gleichzeitig Trainingskosten signifikant.
Das Papier zitiert wichtige Arbeiten in diesem Bereich, einschließlich:
Bengio, Lodi, and Prouvost (2021): ML für kombinatorische Optimierung Übersicht
Bertsimas and Stellato (2022): Online gemischte ganzzahlige Optimierung
Misra, Roald, and Ng (2022): Lernen für eingeschränkte Optimierung
Sowie umfangreiche verwandte End-to-End-Lern- und Lernoptimierungsmethodenliteratur
Gesamtbewertung: Dies ist ein hochqualitatives Forschungspapier, das eine innovative Präferenzlernmethode im ML4CO-Bereich vorschlägt. Obwohl es einige Einschränkungen gibt, sind sowohl der theoretische Beitrag als auch der praktische Wert bemerkenswert und bieten einen neuen effektiven Weg zur Lösung großformatiger MILP-Probleme.