We study proximity (resp. integrality gap), that is, the distance (resp. difference) between the optimal solutions (resp. optimal values) of convex integer programs (IP) and the optimal solutions (resp. optimal values) of their continuous relaxations. We show that these values can be upper bounded in terms of the recession cone of the feasible region of the continuous relaxation when the recession cone is full-dimensional. If the recession cone is not full-dimensional we give sufficient conditions to obtain a finite integrality gap. We then specialize our analysis to second-order conic IPs. In the case the feasible region is defined by a single Lorentz cone constraint, we give upper bounds on proximity and integrality gap in terms of the data of the problem (the objective function vector, the matrix defining the conic constraint, the right-hand side, and the covering radius of a related lattice). We also give conditions for these bounds to be independent of the right-hand side, akin to the linear IP case. Finally, in the case the feasible region is defined by multiple Lorentz cone constraints, we show that, in general, we cannot give bounds that are independent of the corresponding right-hand side. Although our results are presented for the integer lattice $\mathbb{Z}^n$, the bounds can be easily adapted to work for any general lattice, including the usual mixed-integer lattice $\mathbb{Z}^{n_1}\times\mathbb{R}^{n_2}$, by considering the appropriate covering radius when needed.
论文ID : 2501.00638标题 : Proximity results in convex mixed-integer programming作者 : Burak Kocuk (Sabancı University), Diego A. Morán R. (Rensselaer Polytechnic Institute)分类 : math.OC (Optimization and Control)发表时间 : 2024年12月31日论文链接 : https://arxiv.org/abs/2501.00638 本文研究凸整数规划(IP)与其连续松弛之间的接近性(proximity)和整数间隙(integrality gap)问题。作者证明了当连续松弛可行域的recession cone是满维的时,这些值可以用recession cone的参数进行上界估计。对于非满维recession cone的情况,给出了获得有限整数间隙的充分条件。文章特别分析了二阶锥整数规划,在单一Lorentz锥约束的情况下,用问题数据给出了接近性和整数间隙的上界,并提供了这些界与右端项无关的条件。
核心问题 :研究凸整数规划min { α T x : x ∈ S ∩ Z n } \min\{\alpha^T x : x \in S \cap \mathbb{Z}^n\} min { α T x : x ∈ S ∩ Z n } 与其连续松弛min { α T x : x ∈ S } \min\{\alpha^T x : x \in S\} min { α T x : x ∈ S } 之间的距离关系,其中S ⊆ R n S \subseteq \mathbb{R}^n S ⊆ R n 是凸集。两个关键概念 :接近性(Proximity) :连续松弛最优解到最近整数可行解的距离整数间隙(Integrality gap) :整数规划最优值与连续松弛最优值的差研究意义 :量化松弛质量,为算法设计提供理论基础 在凸二次博弈等应用中具有重要价值 扩展线性整数规划的经典结果到非线性情况 线性情况已有完备结果 :Cook等人证明了线性IP的接近性界与右端项无关非线性情况研究有限 :仅限于可分凸函数或可分二次函数的特殊情况缺乏一般性框架 :缺少处理一般凸约束集合的系统性方法一般凸IP的接近性结果 :当recession cone满维时,给出了与最优解无关的接近性和整数间隙上界二阶锥IP的专门分析 :为简单二阶锥集合提供了结构性结果和接近性界右端项依赖性分析 :证明了多Lorentz锥约束情况下,界一般不能与右端项无关混合整数格推广 :结果可扩展到一般格Z n 1 × R n 2 \mathbb{Z}^{n_1} \times \mathbb{R}^{n_2} Z n 1 × R n 2 反例构造 :通过具体例子说明非线性情况的复杂性定理2 (满维recession cone情况):
设S S S 为凸集,其recession cone K : = rec.cone ( S ) K := \text{rec.cone}(S) K := rec.cone ( S ) 是正则的。对x ^ ∈ S x̂ \in S x ^ ∈ S ,有:
Prox x ^ ( S ) : = min x ∈ S ∩ Z n ∥ x − x ^ ∥ 2 ≤ n 2 ( 1 Ψ K , ∥ ⋅ ∥ 2 + 1 ) \text{Prox}_{x̂}(S) := \min_{x \in S \cap \mathbb{Z}^n} \|x - x̂\|_2 \leq \frac{\sqrt{n}}{2}\left(\frac{1}{\Psi_{K,\|\cdot\|_2}} + 1\right) Prox x ^ ( S ) := min x ∈ S ∩ Z n ∥ x − x ^ ∥ 2 ≤ 2 n ( Ψ K , ∥ ⋅ ∥ 2 1 + 1 )
其中Ψ K , ∥ ⋅ ∥ \Psi_{K,\|\cdot\|} Ψ K , ∥ ⋅ ∥ 是锥K K K 的关键参数:
Ψ K , ∥ ⋅ ∥ : = max d ∈ K { min f ∈ K ∗ { f T d : ∥ f ∥ ∗ = 1 } : ∥ d ∥ = 1 } \Psi_{K,\|\cdot\|} := \max_{d \in K} \left\{\min_{f \in K^*} \{f^T d : \|f\|_* = 1\} : \|d\| = 1\right\} Ψ K , ∥ ⋅ ∥ := max d ∈ K { min f ∈ K ∗ { f T d : ∥ f ∥ ∗ = 1 } : ∥ d ∥ = 1 }
定义4 :满维混合整数格L ( E , F ) = { E z + F y : z ∈ Z n 1 , y ∈ R n 2 } L(E,F) = \{Ez + Fy : z \in \mathbb{Z}^{n_1}, y \in \mathbb{R}^{n_2}\} L ( E , F ) = { E z + F y : z ∈ Z n 1 , y ∈ R n 2 } 的覆盖半径为:
μ ( E , F ) = max x { min x ′ { ∥ x − x ′ ∥ 2 : x ′ ∈ L ( E , F ) } : x ∈ R n } \mu(E,F) = \max_x \left\{\min_{x'} \{\|x - x'\|_2 : x' \in L(E,F)\} : x \in \mathbb{R}^n\right\} μ ( E , F ) = max x { min x ′ { ∥ x − x ′ ∥ 2 : x ′ ∈ L ( E , F )} : x ∈ R n }
关键性质 (事实1):对于正交表示,μ ( E , F ) = μ ( E ) \mu(E,F) = \mu(E) μ ( E , F ) = μ ( E ) ,即覆盖半径仅依赖于整数分量。
对于二次集合Q = { x ∈ R n : x T M x − 2 β T x + γ ≤ 0 } Q = \{x \in \mathbb{R}^n : x^T M x - 2\beta^T x + \gamma \leq 0\} Q = { x ∈ R n : x T M x − 2 β T x + γ ≤ 0 } ,根据矩阵M M M 的特征值分类:
椭球 :M ≻ 0 M \succ 0 M ≻ 0 抛物面 :M ⪰ 0 M \succeq 0 M ⪰ 0 ,λ n = 0 \lambda_n = 0 λ n = 0 双曲面/平移锥 :M M M 有负特征值方法1:接近性驱动
给定边界点x ^ x̂ x ^ ,寻找包含整数点的足够大椭球 利用内逼近技术和覆盖半径理论 方法2:整数间隙驱动
通过水平集分析S δ = { x ∈ S : x n = δ } S_\delta = \{x \in S : x_n = \delta\} S δ = { x ∈ S : x n = δ } 寻找半径足够大的椭球截面 锥参数Ψ K \Psi_K Ψ K 的计算 :对Lorentz锥,证明了Ψ L n , ∥ ⋅ ∥ 2 = 1 \Psi_{L^n,\|\cdot\|_2} = 1 Ψ L n , ∥ ⋅ ∥ 2 = 1 大球包含性质 :证明了无界二次集合包含任意大的满维球椭球内逼近 :构造了二次集合的椭球内逼近,用于接近性分析考虑二阶锥IP:
inf x ∈ Z 2 { α 1 x 1 + α 2 x 2 : ∥ [ x 1 − b 1 1 2 x 2 − b 2 ] ∥ 2 ≤ 1 2 x 2 − d } \inf_{x \in \mathbb{Z}^2} \left\{\alpha_1 x_1 + \alpha_2 x_2 : \left\|\begin{bmatrix} x_1 - b_1 \\ \frac{1}{2}x_2 - b_2 \end{bmatrix}\right\|_2 \leq \frac{1}{2}x_2 - d\right\} inf x ∈ Z 2 { α 1 x 1 + α 2 x 2 : [ x 1 − b 1 2 1 x 2 − b 2 ] 2 ≤ 2 1 x 2 − d }
通过参数选择α = [ 1 , 1 ] T \alpha = [1,1]^T α = [ 1 , 1 ] T , b = [ 4 N + 1 2 , 4 N ] T b = [4N+\frac{1}{2}, 4N]^T b = [ 4 N + 2 1 , 4 N ] T , d = 4 N − 1 4 N d = 4N - \frac{1}{4N} d = 4 N − 4 N 1 ,得到整数间隙:
I G ( N ) = N + 5 16 N − 1 2 IG(N) = N + \frac{5}{16N} - \frac{1}{2} I G ( N ) = N + 16 N 5 − 2 1
inf x ∈ Z 2 { x 2 : x 1 2 + x 2 2 ≤ ( N + 1 ) 2 , x 1 ≥ 1 2 } \inf_{x \in \mathbb{Z}^2} \{x_2 : x_1^2 + x_2^2 \leq (N+1)^2, x_1 \geq \frac{1}{2}\} inf x ∈ Z 2 { x 2 : x 1 2 + x 2 2 ≤ ( N + 1 ) 2 , x 1 ≥ 2 1 }
整数间隙为I G ( N ) = N + 3 4 IG(N) = \sqrt{N + \frac{3}{4}} I G ( N ) = N + 4 3 ,显示与右端项的依赖关系。
对椭球S = { x : ∥ Q x − p ∥ 2 ≤ r } S = \{x : \|Qx - p\|_2 \leq r\} S = { x : ∥ Q x − p ∥ 2 ≤ r } :
Prox x ^ ( S ) ≤ 2 ∥ Q ( Q T Q ) − 1 ∥ 2 μ ( Q ) \text{Prox}_{x̂}(S) \leq 2\|Q(Q^TQ)^{-1}\|_2 \mu(Q) Prox x ^ ( S ) ≤ 2∥ Q ( Q T Q ) − 1 ∥ 2 μ ( Q ) I G ( S ) ≤ 2 ∥ Q ( Q T Q ) − 1 α ∥ 2 μ ( Q ) IG(S) \leq 2\|Q(Q^TQ)^{-1}\alpha\|_2 \mu(Q) I G ( S ) ≤ 2∥ Q ( Q T Q ) − 1 α ∥ 2 μ ( Q )
Prox x ^ ( S ) ≤ n 2 + Γ x ^ ( M , β , γ , n 2 ) \text{Prox}_{x̂}(S) \leq \frac{\sqrt{n}}{2} + \Gamma_{x̂}\left(M, \beta, \gamma, \frac{\sqrt{n}}{2}\right) Prox x ^ ( S ) ≤ 2 n + Γ x ^ ( M , β , γ , 2 n )
其中Γ \Gamma Γ 通过半定规划求解。
椭球 (命题13):
情况1:I G ( S ) ≤ q 1 2 − 4 q 2 q 0 − q 2 ≤ 2 μ ( Q ˉ ) 2 − q 2 + 1 4 IG(S) \leq \sqrt{\frac{q_1^2 - 4q_2q_0}{-q_2}} \leq 2\sqrt{\frac{\mu(\bar{Q})^2}{-q_2} + \frac{1}{4}} I G ( S ) ≤ − q 2 q 1 2 − 4 q 2 q 0 ≤ 2 − q 2 μ ( Q ˉ ) 2 + 4 1 情况2:I G ( S ) ≤ μ ( Q ˉ ) − q 2 + 1 IG(S) \leq \frac{\mu(\bar{Q})}{\sqrt{-q_2}} + 1 I G ( S ) ≤ − q 2 μ ( Q ˉ ) + 1 抛物面 (命题14):
I G ( S ) ≤ μ ( Q ˉ ) 2 q 1 + 1 IG(S) \leq \frac{\mu(\bar{Q})^2}{q_1} + 1 I G ( S ) ≤ q 1 μ ( Q ˉ ) 2 + 1
例子8-9 验证了不同方法得到的界:
右端项相关界:精确匹配实际整数间隙 右端项无关界:渐近匹配,提供了实用的上界估计 Cook等人(1986) :线性IP的接近性界与右端项无关最近进展 :Paat等人、Eisenbrand等人的改进结果有限研究 :主要限于可分函数情况缺口 :缺少一般凸约束的系统性分析利用了锥对偶理论和二阶锥的几何性质 扩展了混合整数格的覆盖半径理论 满维recession cone :可以得到与问题数据无关的接近性界简单二阶锥集合 :在某些条件下可以得到与右端项无关的界多锥约束 :一般情况下界必须依赖于右端项方法论 :提供了两种互补的分析方法计算复杂性 :某些界的计算需要解半定规划紧性 :部分界可能不够紧,存在改进空间适用范围 :主要针对二阶锥约束,其他锥类型需要进一步研究实际应用 :理论结果到实际算法的转化需要进一步工作其他锥类型 :扩展到半定锥、指数锥等算法设计 :基于接近性结果设计高效算法界的改进 :寻找更紧的界,特别是常数因子的改进计算方法 :开发高效计算覆盖半径和锥参数的方法理论贡献显著 :首次系统性地分析了凸整数规划的接近性问题方法创新 :提出了两种互补的分析框架结果完备 :涵盖了多种重要的几何对象(椭球、抛物面、双曲面)技术深度 :巧妙结合了凸分析、格理论和锥优化反例构造 :通过具体例子清晰说明了非线性情况的本质困难计算可行性 :部分结果需要解半定规划,计算成本较高界的紧性 :某些情况下界可能过于保守实用性 :理论结果与实际算法设计的距离较大覆盖范围 :主要关注二阶锥,其他重要锥类型覆盖不足理论影响 :为凸整数规划理论奠定了重要基础方法论价值 :分析框架可推广到其他问题实用潜力 :为算法设计提供了理论指导学科交叉 :连接了优化理论、几何学和数论算法分析 :评估启发式算法的性能界问题建模 :指导凸整数规划的建模选择理论研究 :为进一步的理论发展提供基础应用领域 :库存管理、电力系统、工程设计等具体应用论文引用了29篇重要文献,主要包括:
Cook, W. et al. (1986) - 线性IP接近性的经典结果 Belotti, P. et al. (2013, 2017) - 二次曲面的特征化理论 Ben-Tal, A. & Nemirovski, A. (2001) - 现代凸优化理论 Bertsimas, D. & Weismantel, R. (2005) - 整数优化基础理论 Paat, J. et al. (2020) - 混合整数规划的最新进展 这篇论文在凸整数规划的接近性分析方面做出了重要的理论贡献,为这一重要问题提供了系统性的分析框架,具有很高的学术价值和潜在的应用前景。