Fast and Interpretable Mixed-Integer Linear Program Solving by Learning Model Reduction
Li, Chen, Li et al.
By exploiting the correlation between the structure and the solution of Mixed-Integer Linear Programming (MILP), Machine Learning (ML) has become a promising method for solving large-scale MILP problems. Existing ML-based MILP solvers mainly focus on end-to-end solution learning, which suffers from the scalability issue due to the high dimensionality of the solution space. Instead of directly learning the optimal solution, this paper aims to learn a reduced and equivalent model of the original MILP as an intermediate step. The reduced model often corresponds to interpretable operations and is much simpler, enabling us to solve large-scale MILP problems much faster than existing commercial solvers. However, current approaches rely only on the optimal reduced model, overlooking the significant preference information of all reduced models. To address this issue, this paper proposes a preference-based model reduction learning method, which considers the relative performance (i.e., objective cost and constraint feasibility) of all reduced models on each MILP instance as preferences. We also introduce an attention mechanism to capture and represent preference information, which helps improve the performance of model reduction learning tasks. Moreover, we propose a SetCover based pruning method to control the number of reduced models (i.e., labels), thereby simplifying the learning process. Evaluation on real-world MILP problems shows that 1) compared to the state-of-the-art model reduction ML methods, our method obtains nearly 20% improvement on solution accuracy, and 2) compared to the commercial solver Gurobi, two to four orders of magnitude speedups are achieved.
academic
Быстрое и интерпретируемое решение смешанных целочисленных линейных программ посредством обучения сокращению модели
В данной работе предлагается метод решения крупномасштабных задач смешанного целочисленного линейного программирования (MILP) на основе машинного обучения, использующий корреляцию между структурой MILP и её решением. В отличие от существующих методов обучения решению "конец в конец", данная работа изучает упрощённую эквивалентную модель исходной MILP в качестве промежуточного этапа. Предложен метод обучения сокращению модели на основе предпочтений, учитывающий относительную производительность всех сокращённых моделей для каждого экземпляра MILP в качестве информации о предпочтениях и использующий механизм внимания для захвата этой информации. Экспериментальные результаты показывают повышение точности решения на ~20% по сравнению с передовыми методами сокращения модели на основе ML и ускорение в 2-4 порядка величины по сравнению с коммерческим решателем Gurobi.
Смешанное целочисленное линейное программирование (MILP) широко применяется в критических областях, таких как логистика цепи поставок, планирование услуг, управление энергией и транспортное планирование. В практических промышленных приложениях экземпляры MILP обычно включают сотни тысяч переменных решения и ограничений. Существующие коммерческие решатели, основанные на точных методах решения, требуют высоких вычислительных затрат и не могут удовлетворить требования реального времени.
Проблемы масштабируемости: Существующие методы ML непосредственно изучают отображение в высокомерное пространство решений, что создаёт проблемы масштабируемости
Отсутствие интерпретируемости: Методы "конец в конец" не могут обеспечить интерпретируемые решения или интуитивное понимание
Недостаточное использование информации о предпочтениях: Существующие методы сокращения модели сосредоточены только на оптимальной сокращённой модели, игнорируя важную информацию о предпочтениях всех сокращённых моделей
Прямое предсказание решения: Низкая точность предсказания из-за высокой размерности пространства решений
Обучение оптимизации: Ограниченная эффективность из-за ограничений горизонта принятия решений
Существующие методы сокращения модели: Рассматривают все допустимые сокращённые модели как эквивалентные идеальные метки, не полностью используя информацию о сравнении
Предложен метод обучения сокращению модели на основе предпочтений: Преобразует производительность сокращённых моделей в информацию о предпочтениях, полностью используя информацию о сравнении в пространстве экземпляр-стратегия
Разработана архитектура механизма внимания: Захватывает корреляцию между экземпляром и предпочтительными сокращёнными моделями, повышая точность обучения
Введена техника обрезки SETCOVER: Контролирует количество сокращённых моделей (меток), генерируя минимальный набор меток, допустимый для всех экземпляров
Достигнуто значительное повышение производительности: Проверено на реальных задачах MILP, повышение точности на 20% по сравнению с существующими методами и ускорение в 2-4 порядка величины по сравнению с Gurobi
min f(c, x)
s.t. g(A, x) ≤ b
xI ∈ Z^d, x_{-I} ∈ R^{n-d}
где θ = ⟨A, c, b⟩ обозначает параметры MILP.
Определение оптимальной стратегии: s*(θ) = (T(θ), x*_I(θ)), включающей набор активных ограничений T(θ) и значения целочисленных переменных при оптимальном решении.
Цель: Изучить отображение из параметров θ в оптимальную стратегию s*(θ).
Использует транзитивность предпочтений, упорядочивая стратегии по предпочтениям, требуя только M_P упорядоченных образцов предпочтений вместо (M_P choose 2) попарных сравнений, снижая сложность выборки с квадратичной до линейной.
На этапе онлайн-вывода выбирает Top-k выходных стратегий в качестве кандидатов, оценивая сокращённые модели и выбирая стратегию с наименьшей недопустимостью.
На наборе данных топливных элементов метод предпочтений показывает повышение средней точности на ~9% по сравнению с прямой подгонкой вознаграждений, с лучшей производительностью по метрикам недопустимости и субоптимальности.
Упорядоченный метод показывает повышение средней точности на ~8% по сравнению с традиционной выборкой парных предпочтений при различных масштабах задач, одновременно значительно снижая затраты на обучение.
Статья ссылается на важные работы в данной области, включая:
Bengio, Lodi, and Prouvost (2021): Обзор машинного обучения для комбинаторной оптимизации
Bertsimas and Stellato (2022): Онлайн смешанное целочисленное программирование
Misra, Roald, and Ng (2022): Обучение для оптимизации с ограничениями
И большое количество связанных работ по обучению "конец в конец" и обучению оптимизации
Общая оценка: Это высококачественная исследовательская работа, предлагающая инновационный метод обучения предпочтениям в области ML4CO. Несмотря на некоторые ограничения, её теоретический вклад и практическая ценность весьма значительны, предоставляя новый эффективный путь для решения крупномасштабных задач MILP.