Fast and Interpretable Mixed-Integer Linear Program Solving by Learning Model Reduction
Li, Chen, Li et al.
By exploiting the correlation between the structure and the solution of Mixed-Integer Linear Programming (MILP), Machine Learning (ML) has become a promising method for solving large-scale MILP problems. Existing ML-based MILP solvers mainly focus on end-to-end solution learning, which suffers from the scalability issue due to the high dimensionality of the solution space. Instead of directly learning the optimal solution, this paper aims to learn a reduced and equivalent model of the original MILP as an intermediate step. The reduced model often corresponds to interpretable operations and is much simpler, enabling us to solve large-scale MILP problems much faster than existing commercial solvers. However, current approaches rely only on the optimal reduced model, overlooking the significant preference information of all reduced models. To address this issue, this paper proposes a preference-based model reduction learning method, which considers the relative performance (i.e., objective cost and constraint feasibility) of all reduced models on each MILP instance as preferences. We also introduce an attention mechanism to capture and represent preference information, which helps improve the performance of model reduction learning tasks. Moreover, we propose a SetCover based pruning method to control the number of reduced models (i.e., labels), thereby simplifying the learning process. Evaluation on real-world MILP problems shows that 1) compared to the state-of-the-art model reduction ML methods, our method obtains nearly 20% improvement on solution accuracy, and 2) compared to the commercial solver Gurobi, two to four orders of magnitude speedups are achieved.
academic
Risoluzione veloce e interpretabile di programmi lineari interi misti mediante apprendimento della riduzione del modello
Questo articolo propone un metodo di risoluzione basato su apprendimento automatico per problemi MILP (Mixed-Integer Linear Programming) su larga scala, sfruttando la correlazione tra la struttura e la soluzione dei MILP. A differenza dei metodi di apprendimento end-to-end esistenti, questo articolo apprende modelli equivalenti ridotti del MILP originale come fase intermedia. Il metodo propone un approccio di apprendimento della riduzione del modello basato su preferenze, considerando le prestazioni relative di tutti i modelli ridotti su ogni istanza MILP come informazione di preferenza, e introduce un meccanismo di attenzione per catturare tale informazione. I risultati sperimentali mostrano che, rispetto ai metodi ML di riduzione del modello all'avanguardia, questo metodo migliora la precisione della soluzione di quasi il 20%, e rispetto al risolutore commerciale Gurobi realizza un'accelerazione di 2-4 ordini di grandezza.
La programmazione lineare intera mista (MILP) ha applicazioni diffuse in settori critici come la logistica della catena di approvvigionamento, la pianificazione dei servizi, la gestione dell'energia e la pianificazione dei trasporti. Nelle applicazioni industriali reali, le istanze MILP coinvolgono tipicamente decine di migliaia di variabili decisionali e vincoli. I risolutori commerciali esistenti si basano su metodi di soluzione esatti con costi computazionali elevati, incapaci di soddisfare i requisiti in tempo reale.
Problema di scalabilità: I metodi ML esistenti apprendono direttamente la mappatura dello spazio di soluzione ad alta dimensione, presentando problemi di scalabilità
Mancanza di interpretabilità: Gli approcci end-to-end non forniscono soluzioni interpretabili o comprensione intuitiva
Utilizzo insufficiente dell'informazione di preferenza: I metodi di riduzione del modello esistenti si concentrano solo sul modello ridotto ottimale, trascurando l'importante informazione di preferenza di tutti i modelli ridotti
Previsione end-to-end della soluzione: La bassa precisione di previsione dovuta alla dimensionalità dello spazio di soluzione
Apprendimento dell'ottimizzazione: Efficienza limitata dai vincoli dell'orizzonte decisionale
Metodi di riduzione del modello esistenti: Trattano i modelli ridotti fattibili come etichette ideali equivalenti, non sfruttando pienamente le informazioni comparative
Propone un metodo di apprendimento della riduzione del modello basato su preferenze: Converte le prestazioni dei modelli ridotti in informazioni di preferenza, sfruttando pienamente le informazioni comparative nello spazio istanza-strategia
Progetta un'architettura con meccanismo di attenzione: Cattura la correlazione tra istanze e modelli ridotti preferiti, migliorando l'accuratezza dell'apprendimento
Introduce la tecnica di potatura SETCOVER: Controlla il numero di modelli ridotti (etichette), generando l'insieme di etichette minimo fattibile per tutte le istanze
Realizza miglioramenti significativi delle prestazioni: Verificato su problemi MILP reali, con miglioramento della precisione del 20% rispetto ai metodi esistenti e accelerazione di 2-4 ordini di grandezza rispetto a Gurobi
min f(c, x)
s.t. g(A, x) ≤ b
xI ∈ Z^d, x_{-I} ∈ R^{n-d}
dove θ = ⟨A, c, b⟩ rappresenta i parametri MILP.
Definizione della strategia ottimale: s*(θ) = (T(θ), x*_I(θ)), che include l'insieme dei vincoli stretti T(θ) e i valori delle variabili intere nella soluzione ottimale.
Obiettivo: Apprendere la mappatura dai parametri θ alla strategia ottimale s*(θ).
Sfrutta la transitività delle preferenze, ordinando le strategie per preferenza, richiedendo solo M_P campioni di preferenza ordinati anziché (M_P choose 2) confronti accoppiati, riducendo la complessità del campione da quadratica a lineare.
Sul dataset delle celle a combustibile, il metodo delle preferenze mostra un miglioramento medio dell'accuratezza di circa il 9% rispetto all'adattamento diretto della ricompensa, con prestazioni superiori nelle metriche di infeasibility e suboptimality.
Il metodo ordinato mostra un miglioramento medio dell'accuratezza di circa l'8% rispetto al campionamento di preferenza tradizionale su varie scale di problema, riducendo significativamente i costi di addestramento.
L'articolo cita importanti lavori nel campo, inclusi:
Bengio, Lodi, and Prouvost (2021): Sondaggio su ML per l'ottimizzazione combinatoria
Bertsimas and Stellato (2022): Ottimizzazione intera mista online
Misra, Roald, and Ng (2022): Apprendimento per l'ottimizzazione vincolata
E numerosi altri lavori correlati su apprendimento end-to-end e apprendimento dell'ottimizzazione
Valutazione complessiva: Questo è un articolo di ricerca di alta qualità che propone un metodo innovativo di apprendimento delle preferenze nel campo ML4CO. Sebbene presenti alcune limitazioni, i suoi contributi teorici e il valore pratico sono entrambi notevoli, fornendo un nuovo percorso efficace per la risoluzione di MILP su larga scala.