Small regularizers can preserve linear programming solutions exactly. This paper provides the first average-case analysis of exact regularization: with a standard Gaussian cost vector and fixed constraint set, bounds are established for the probability that exact regularization succeeds as a function of regularization strength. Failure is characterized via the Gaussian measure of inner cones, controlled by novel two-sided bounds on the measure of shifted cones. Results reveal dimension-dependent scaling laws and connect exact regularization of linear programs to their polyhedral geometry via the normal fan and the Gaussian (solid-angle) measure of its cones. Computable bounds are obtained in several canonical settings, including regularized optimal transport. Numerical experiments corroborate the predicted scalings and thresholds.
论文ID : 2510.13083标题 : Average-case thresholds for exact regularization of linear programs作者 : Michael P. Friedlander, Sharvaj Kubal, Yaniv Plan, Matthew S. Scott分类 : math.OC cs.NA math.NA math.PR发表时间 : 2025年10月15日论文链接 : https://arxiv.org/abs/2510.13083 小的正则化器可以精确保持线性规划解。本文提供了精确正则化的首个平均情况分析:在标准高斯成本向量和固定约束集的情况下,建立了精确正则化成功概率关于正则化强度的界限。失败通过内锥的高斯测度来刻画,由移位锥测度的新双边界限控制。结果揭示了维度依赖的缩放律,并通过法锥扇和其锥的高斯(立体角)测度将线性规划的精确正则化与其多面体几何联系起来。在几个典型设置中获得了可计算界限,包括正则化最优传输。数值实验证实了预测的缩放和阈值。
本文研究的核心问题是精确正则化 现象:对于线性规划问题
(P0) min { − g ⋅ x ∣ A x ≤ b } \text{(P0)} \quad \min \{-g \cdot x | Ax \leq b\} (P0) min { − g ⋅ x ∣ A x ≤ b }
及其正则化版本
(P ε ) min { − g ⋅ x + ε ψ ( x ) ∣ A x ≤ b } \text{(P}_\varepsilon\text{)} \quad \min \{-g \cdot x + \varepsilon\psi(x) | Ax \leq b\} (P ε ) min { − g ⋅ x + ε ψ ( x ) ∣ A x ≤ b }
当正则化参数ε \varepsilon ε 足够小时,正则化问题的解仍然是原问题的解,即Sol ( P ε ) ⊆ Sol ( P 0 ) \text{Sol}(\text{P}_\varepsilon) \subseteq \text{Sol}(\text{P}_0) Sol ( P ε ) ⊆ Sol ( P 0 ) 。
计算挑战 :线性规划可能存在非唯一解和对数据扰动的极端敏感性,正则化可以缓解这些问题理论空白 :现有的确定性分析需要先解决原问题才能确定精确正则化阈值ε ˉ \bar{\varepsilon} ε ˉ 实际需求 :在最优传输等应用中,二次正则化比熵正则化更能保持稀疏性几何洞察 :通过概率分析揭示精确正则化与多面体几何的深层联系Mangasarian和Meyer的确定性理论需要同时求解P0和选择问题P_ψ González-Sanz和Nutz的界限在平均情况下过于宽松(改进了n倍) 缺乏维度依赖的缩放律分析 移位锥的高斯测度界限 :建立了Theorem 1.3,提供了锥V+w的高斯测度双边界限几何刻画 :证明了精确正则化概率等于所有顶点处内锥高斯测度之和(Theorem 1.5)内锥界限套件 :通过成员条件(Theorem 2.1)和表示向量(Theorem 2.5)发展了全面的界限边缘集分析 :通过面结构提供边缘集的双边界限(Lemma 3.2,Theorem 3.3)具体应用 :为∞-球约束和正则化最优传输提供了最优界限(up to常数)给定多面体可行域Q = { x ∈ R n ∣ A x ≤ b } Q = \{x \in \mathbb{R}^n | Ax \leq b\} Q = { x ∈ R n ∣ A x ≤ b } 和正则化函数ψ \psi ψ ,分析当成本向量g ∼ N ( 0 , I n ) g \sim N(0, I_n) g ∼ N ( 0 , I n ) 时,精确正则化事件ER ( ε ) \text{ER}(\varepsilon) ER ( ε ) 的概率。
对于x ∈ Q x \in Q x ∈ Q ,法锥定义为:
N ( x ) : = { v ∈ R n ∣ v ⋅ ( y − x ) ≤ 0 for all y ∈ Q } N(x) := \{v \in \mathbb{R}^n | v \cdot (y-x) \leq 0 \text{ for all } y \in Q\} N ( x ) := { v ∈ R n ∣ v ⋅ ( y − x ) ≤ 0 for all y ∈ Q }
关键性质(Proposition 1.1):
N ( z ) N(z) N ( z ) 是n n n 维的当且仅当z ∈ Vert ( Q ) z \in \text{Vert}(Q) z ∈ Vert ( Q ) 顶点处的法锥几乎分割整个空间:⋃ z ∈ Vert ( Q ) N ( z ) = R n \bigcup_{z \in \text{Vert}(Q)} N(z) = \mathbb{R}^n ⋃ z ∈ Vert ( Q ) N ( z ) = R n P0的最优性:g ∈ N ( z ) g \in N(z) g ∈ N ( z ) P_ε的最优性:g ∈ N ( z ) + ∂ ( ε ψ ) ( z ) g \in N(z) + \partial(\varepsilon\psi)(z) g ∈ N ( z ) + ∂ ( ε ψ ) ( z ) Theorem 1.3 (核心技术结果):对于锥V ⊆ R d V \subseteq \mathbb{R}^d V ⊆ R d 和向量w ∈ R d w \in \mathbb{R}^d w ∈ R d ,
γ ( V + w ) ∈ [ γ ( V ) exp ( − 1 2 ∥ w ∥ 2 − dist ( w , − V ∗ ) d ) , γ ( V ) exp ( − 1 2 ∥ Π V ∗ w ∥ 2 + dist ( w , V ∗ ) d ) ] \gamma(V + w) \in \left[\gamma(V) \exp\left(-\frac{1}{2}\|w\|^2 - \text{dist}(w, -V^*)\sqrt{d}\right), \gamma(V) \exp\left(-\frac{1}{2}\|\Pi_{V^*}w\|^2 + \text{dist}(w, V^*)\sqrt{d}\right)\right] γ ( V + w ) ∈ [ γ ( V ) exp ( − 2 1 ∥ w ∥ 2 − dist ( w , − V ∗ ) d ) , γ ( V ) exp ( − 2 1 ∥ Π V ∗ w ∥ 2 + dist ( w , V ∗ ) d ) ]
证明技巧:
上界:使用Hölder不等式和弱对偶性,通过优化方差参数κ \kappa κ 下界:Jensen不等式结合Moreau分解 当∂ ( ε ψ ) ( z ) ∩ N ( z ) ≠ ∅ \partial(\varepsilon\psi)(z) \cap N(z) \neq \emptyset ∂ ( ε ψ ) ( z ) ∩ N ( z ) = ∅ 时,内锥简化为N ( z ) + w N(z) + w N ( z ) + w ,直接应用Theorem 1.3。
对于不满足成员条件的情况,构造表示向量w ~ = S T − 1 ( S T w ) + \tilde{w} = S_T^{-1}(S_T w)_+ w ~ = S T − 1 ( S T w ) + ,使得:
M ( T , w ) = M ( T , w ~ ) M(T, w) = M(T, \tilde{w}) M ( T , w ) = M ( T , w ~ )
其中M ( T , w ) = T ∖ ( T + w ) M(T, w) = T \setminus (T + w) M ( T , w ) = T ∖ ( T + w ) 是边缘集。
Lemma 3.1 :边缘集可以分解为
γ ( M ( T , w ) ) ≤ ∑ i = 1 ℓ γ ( P i ) \gamma(M(T, w)) \leq \sum_{i=1}^\ell \gamma(P^i) γ ( M ( T , w )) ≤ ∑ i = 1 ℓ γ ( P i )
其中P i = ⋃ t ∈ [ 0 , 1 ) [ T i + t w ] P^i = \bigcup_{t \in [0,1)} [T^i + tw] P i = ⋃ t ∈ [ 0 , 1 ) [ T i + tw ] (当s i ⋅ w > 0 s_i \cdot w > 0 s i ⋅ w > 0 时)。
Birkhoff多面体 (双随机矩阵)上的二次正则化∞-球 上的二次和线性正则化维度范围:n ∈ [ 10 3 , 10 4 ] n \in [10^3, 10^4] n ∈ [ 1 0 3 , 1 0 4 ] 每个( n , ε ) (n, \varepsilon) ( n , ε ) 对进行20次独立试验 精确正则化失败概率P ( ER c ( ε ) ) P(\text{ER}^c(\varepsilon)) P ( ER c ( ε )) 期望正则化阈值E [ ε ˉ ] E[\bar{\varepsilon}] E [ ε ˉ ] 理论界限与经验观察的对比 理论预测:
失败概率界限:P ( ER c ( ε ) ) ≤ 1 2 ε 2 n + ε n 3 / 4 P(\text{ER}^c(\varepsilon)) \leq \frac{1}{2}\varepsilon^2\sqrt{n} + \varepsilon n^{3/4} P ( ER c ( ε )) ≤ 2 1 ε 2 n + ε n 3/4 期望阈值下界:E [ ε ˉ ] ≥ 1 − e − 4 n 2 n 3 / 4 E[\bar{\varepsilon}] \geq \frac{1-e^{-4n}}{2n^{3/4}} E [ ε ˉ ] ≥ 2 n 3/4 1 − e − 4 n 实验验证:
水平曲线ε n 3 / 4 = 2 \varepsilon n^{3/4} = 2 ε n 3/4 = 2 处的经验失败概率约为0.5,与理论界限0.875一致 缩放关系在对数尺度上表现为直线,证实了维度依赖性 二次正则化 :
理论界限:P ( ER c ( ε ) ) ≤ ε n + 1 2 ε 2 n P(\text{ER}^c(\varepsilon)) \leq \varepsilon n + \frac{1}{2}\varepsilon^2 n P ( ER c ( ε )) ≤ ε n + 2 1 ε 2 n 当ε < n − 1 \varepsilon < n^{-1} ε < n − 1 时,第一项占主导,界限在常数因子2 π e \sqrt{2\pi e} 2 π e 内最优 线性正则化 :
边缘方法给出更紧界限:P ( ER c ( ε ) ) ≤ 1 2 π ε ∥ p ∥ 1 exp ( ε n − 1 ∥ p ∥ ) P(\text{ER}^c(\varepsilon)) \leq \frac{1}{\sqrt{2\pi}}\varepsilon\|p\|_1 \exp(\varepsilon\sqrt{n-1}\|p\|) P ( ER c ( ε )) ≤ 2 π 1 ε ∥ p ∥ 1 exp ( ε n − 1 ∥ p ∥ ) 对几乎稀疏向量p p p (由比率∥ p ∥ 1 / ( n ∥ p ∥ ) \|p\|_1/(\sqrt{n}\|p\|) ∥ p ∥ 1 / ( n ∥ p ∥ ) 量化)更有效 Proposition 4.1 证明了∞-球上的下界:
P ( ER c ( ε ) ) ≥ 1 − exp ( − 2 π e n ε ) P(\text{ER}^c(\varepsilon)) \geq 1 - \exp\left(-\sqrt{\frac{2}{\pi e}}n\varepsilon\right) P ( ER c ( ε )) ≥ 1 − exp ( − π e 2 n ε )
对于ε ≤ ( π e ) / 2 ⋅ 1 2 n \varepsilon \leq \sqrt{(\pi e)/2} \cdot \frac{1}{2n} ε ≤ ( π e ) /2 ⋅ 2 n 1 ,有P ( ER c ( ε ) ) ≥ 1 2 π e n ε P(\text{ER}^c(\varepsilon)) \geq \frac{1}{\sqrt{2\pi e}}n\varepsilon P ( ER c ( ε )) ≥ 2 π e 1 n ε 。
Mangasarian和Meyer 1979 :建立基本条件 Friedlander和Tseng 2008 :一般凸规划的刻画 通过对偶选择问题P ψ \text{P}_\psi P ψ 刻画阈值ε ˉ \bar{\varepsilon} ε ˉ Cuturi 2013 :熵正则化的Sinkhorn算法 González-Sanz和Nutz 2024 :二次正则化的精确性 本文改进了他们的界限E [ ε ˉ ] ≥ c / ( 4 n 2 ) E[\bar{\varepsilon}] \geq c/(4n^2) E [ ε ˉ ] ≥ c / ( 4 n 2 ) 到E [ ε ˉ ] ≥ 1 / ( 4 n ) E[\bar{\varepsilon}] \geq 1/(4n) E [ ε ˉ ] ≥ 1/ ( 4 n ) 维度缩放律 :精确正则化阈值具有明确的维度依赖性,如∝ n − 3 / 4 \propto n^{-3/4} ∝ n − 3/4 (Birkhoff多面体)和∝ n − 1 \propto n^{-1} ∝ n − 1 (∞-球)几何联系 :通过法锥扇的高斯测度建立了精确正则化与多面体几何的深层联系软相变 :存在明确的相变阈值,小ε \varepsilon ε 时高概率成功,大ε \varepsilon ε 时高概率失败多面体限制 :分析局限于多面体可行域高斯假设 :成本向量必须是高斯分布计算复杂性 :某些界限需要计算所有顶点的法锥解距离界限 :当精确正则化失败时,dist ( x ε , Sol ( P 0 ) ) \text{dist}(x_\varepsilon, \text{Sol}(\text{P}_0)) dist ( x ε , Sol ( P 0 )) 的概率界限支撑单调性 :量化二次约束正则化LP中支撑单调性的概率一般锥规划 :扩展到二次和半定约束理论创新 :首次提供精确正则化的平均情况分析,填补重要理论空白技术深度 :移位锥高斯测度的双边界限是核心技术贡献实用价值 :为正则化最优传输等应用提供可计算界限几何洞察 :揭示了精确正则化与多面体几何的深层联系实验验证 :数值实验充分验证了理论预测适用范围 :限制于多面体约束和高斯成本向量常数优化 :某些界限中的常数可能不够紧计算复杂性 :实际应用中计算所有顶点法锥可能困难理论贡献 :为随机线性规划理论提供新工具应用价值 :对最优传输和稀疏优化具有实际指导意义方法论 :移位锥分析技术可推广到其他问题需要理解正则化效果的线性规划应用 最优传输中的正则化参数选择 高维线性规划的鲁棒性分析 稀疏优化中的精确恢复保证 本文引用了36篇相关文献,主要包括:
经典凸优化理论(Rockafellar, Hiriart-Urruty & Lemaréchal) 精确正则化理论(Mangasarian & Meyer, Friedlander & Tseng) 最优传输(Cuturi, González-Sanz & Nutz) 高维概率(Vershynin, Ledoux & Talagrand)