Small regularizers can preserve linear programming solutions exactly. This paper provides the first average-case analysis of exact regularization: with a standard Gaussian cost vector and fixed constraint set, bounds are established for the probability that exact regularization succeeds as a function of regularization strength. Failure is characterized via the Gaussian measure of inner cones, controlled by novel two-sided bounds on the measure of shifted cones. Results reveal dimension-dependent scaling laws and connect exact regularization of linear programs to their polyhedral geometry via the normal fan and the Gaussian (solid-angle) measure of its cones. Computable bounds are obtained in several canonical settings, including regularized optimal transport. Numerical experiments corroborate the predicted scalings and thresholds.
논문 ID : 2510.13083제목 : Average-case thresholds for exact regularization of linear programs저자 : Michael P. Friedlander, Sharvaj Kubal, Yaniv Plan, Matthew S. Scott분류 : math.OC cs.NA math.NA math.PR발표 시간 : 2025년 10월 15일논문 링크 : https://arxiv.org/abs/2510.13083 작은 정규화 매개변수는 선형계획법의 해를 정확히 보존할 수 있습니다. 본 논문은 정확한 정규화에 대한 첫 번째 평균 경우 분석을 제공합니다: 표준 가우스 비용 벡터와 고정된 제약 집합 하에서, 정규화 강도에 대한 정확한 정규화 성공 확률의 경계를 확립합니다. 실패는 내부 원뿔의 가우스 측도로 특성화되며, 이동된 원뿔 측도의 새로운 양측 경계로 제어됩니다. 결과는 차원 의존적 스케일링 법칙을 드러내며, 법선 원뿔 부채꼴과 그 원뿔의 가우스(입체각) 측도를 통해 선형계획법의 정확한 정규화를 다면체 기하학과 연결합니다. 정규화된 최적 수송을 포함한 여러 전형적인 설정에서 계산 가능한 경계를 얻습니다. 수치 실험은 예측된 스케일링과 임계값을 확인합니다.
본 논문이 연구하는 핵심 문제는 정확한 정규화 현상입니다: 선형계획법 문제
(P0) min { − g ⋅ x ∣ A x ≤ b } \text{(P0)} \quad \min \{-g \cdot x | Ax \leq b\} (P0) min { − g ⋅ x ∣ A x ≤ b }
및 그 정규화 버전
(P ε ) min { − g ⋅ x + ε ψ ( x ) ∣ A x ≤ b } \text{(P}_\varepsilon\text{)} \quad \min \{-g \cdot x + \varepsilon\psi(x) | Ax \leq b\} (P ε ) min { − g ⋅ x + ε ψ ( x ) ∣ A x ≤ b }
에서 정규화 매개변수 ε \varepsilon ε 이 충분히 작을 때, 정규화된 문제의 해가 여전히 원래 문제의 해입니다. 즉, Sol ( P ε ) ⊆ Sol ( P 0 ) \text{Sol}(\text{P}_\varepsilon) \subseteq \text{Sol}(\text{P}_0) Sol ( P ε ) ⊆ Sol ( P 0 ) 입니다.
계산 과제 : 선형계획법은 비유일 해와 데이터 교란에 대한 극단적 민감성을 가질 수 있으며, 정규화는 이러한 문제를 완화할 수 있습니다이론적 공백 : 기존의 결정론적 분석은 정확한 정규화 임계값 ε ˉ \bar{\varepsilon} ε ˉ 을 결정하기 위해 먼저 원래 문제를 풀어야 합니다실제 필요성 : 최적 수송 등의 응용에서 이차 정규화는 엔트로피 정규화보다 희소성을 더 잘 보존합니다기하학적 통찰 : 확률 분석을 통해 정확한 정규화와 다면체 기하학 사이의 깊은 연결을 드러냅니다Mangasarian과 Meyer의 결정론적 이론은 P0과 선택 문제 P_ψ를 동시에 풀어야 합니다 González-Sanz와 Nutz의 경계는 평균 경우에 너무 느슨합니다(n배 개선됨) 차원 의존적 스케일링 법칙 분석이 부족합니다 이동된 원뿔의 가우스 측도 경계 : 정리 1.3을 확립하여 원뿔 V+w의 가우스 측도 양측 경계를 제공합니다기하학적 특성화 : 정확한 정규화 확률이 모든 꼭짓점에서의 내부 원뿔 가우스 측도의 합과 같음을 증명합니다(정리 1.5)내부 원뿔 경계 모음 : 멤버십 조건(정리 2.1)과 표현 벡터(정리 2.5)를 통해 포괄적인 경계를 개발합니다경계 집합 분석 : 면 구조를 통해 경계 집합의 양측 경계를 제공합니다(보조정리 3.2, 정리 3.3)구체적 응용 : ∞-구 제약과 정규화된 최적 수송에 대해 최적 경계를 제공합니다(상수까지)다면체 가능 영역 Q = { x ∈ R n ∣ A x ≤ b } Q = \{x \in \mathbb{R}^n | Ax \leq b\} Q = { x ∈ R n ∣ A x ≤ b } 와 정규화 함수 ψ \psi ψ 가 주어졌을 때, 비용 벡터 g ∼ N ( 0 , I n ) g \sim N(0, I_n) g ∼ N ( 0 , I n ) 일 때 정확한 정규화 사건 ER ( ε ) \text{ER}(\varepsilon) ER ( ε ) 의 확률을 분석합니다.
x ∈ Q x \in Q x ∈ Q 에 대해 법선 원뿔은 다음과 같이 정의됩니다:
N ( x ) : = { v ∈ R n ∣ v ⋅ ( y − x ) ≤ 0 for all y ∈ Q } N(x) := \{v \in \mathbb{R}^n | v \cdot (y-x) \leq 0 \text{ for all } y \in Q\} N ( x ) := { v ∈ R n ∣ v ⋅ ( y − x ) ≤ 0 for all y ∈ Q }
주요 성질(명제 1.1):
N ( z ) N(z) N ( z ) 가 n차원인 것은 z ∈ Vert ( Q ) z \in \text{Vert}(Q) z ∈ Vert ( Q ) 일 때만입니다꼭짓점에서의 법선 원뿔은 거의 전체 공간을 분할합니다: ⋃ z ∈ Vert ( Q ) N ( z ) = R n \bigcup_{z \in \text{Vert}(Q)} N(z) = \mathbb{R}^n ⋃ z ∈ Vert ( Q ) N ( z ) = R n P0의 최적성: g ∈ N ( z ) g \in N(z) g ∈ N ( z ) P_ε의 최적성: g ∈ N ( z ) + ∂ ( ε ψ ) ( z ) g \in N(z) + \partial(\varepsilon\psi)(z) g ∈ N ( z ) + ∂ ( ε ψ ) ( z ) 정리 1.3 (핵심 기술 결과): 원뿔 V ⊆ R d V \subseteq \mathbb{R}^d V ⊆ R d 와 벡터 w ∈ R d w \in \mathbb{R}^d w ∈ R d 에 대해,
γ ( V + w ) ∈ [ γ ( V ) exp ( − 1 2 ∥ w ∥ 2 − dist ( w , − V ∗ ) d ) , γ ( V ) exp ( − 1 2 ∥ Π V ∗ w ∥ 2 + dist ( w , V ∗ ) d ) ] \gamma(V + w) \in \left[\gamma(V) \exp\left(-\frac{1}{2}\|w\|^2 - \text{dist}(w, -V^*)\sqrt{d}\right), \gamma(V) \exp\left(-\frac{1}{2}\|\Pi_{V^*}w\|^2 + \text{dist}(w, V^*)\sqrt{d}\right)\right] γ ( V + w ) ∈ [ γ ( V ) exp ( − 2 1 ∥ w ∥ 2 − dist ( w , − V ∗ ) d ) , γ ( V ) exp ( − 2 1 ∥ Π V ∗ w ∥ 2 + dist ( w , V ∗ ) d ) ]
증명 기법:
상한: Hölder 부등식과 약한 쌍대성을 사용하여 분산 매개변수 κ \kappa κ 를 최적화합니다 하한: Jensen 부등식과 Moreau 분해를 결합합니다 ∂ ( ε ψ ) ( z ) ∩ N ( z ) ≠ ∅ \partial(\varepsilon\psi)(z) \cap N(z) \neq \emptyset ∂ ( ε ψ ) ( z ) ∩ N ( z ) = ∅ 일 때, 내부 원뿔은 N ( z ) + w N(z) + w N ( z ) + w 로 단순화되어 정리 1.3을 직접 적용합니다.
멤버십 조건을 만족하지 않는 경우, 표현 벡터 w ~ = S T − 1 ( S T w ) + \tilde{w} = S_T^{-1}(S_T w)_+ w ~ = S T − 1 ( S T w ) + 를 구성하여:
M ( T , w ) = M ( T , w ~ ) M(T, w) = M(T, \tilde{w}) M ( T , w ) = M ( T , w ~ )
여기서 M ( T , w ) = T ∖ ( T + w ) M(T, w) = T \setminus (T + w) M ( T , w ) = T ∖ ( T + w ) 는 경계 집합입니다.
보조정리 3.1 : 경계 집합은 다음과 같이 분해될 수 있습니다
γ ( M ( T , w ) ) ≤ ∑ i = 1 ℓ γ ( P i ) \gamma(M(T, w)) \leq \sum_{i=1}^\ell \gamma(P^i) γ ( M ( T , w )) ≤ ∑ i = 1 ℓ γ ( P i )
여기서 P i = ⋃ t ∈ [ 0 , 1 ) [ T i + t w ] P^i = \bigcup_{t \in [0,1)} [T^i + tw] P i = ⋃ t ∈ [ 0 , 1 ) [ T i + tw ] (s i ⋅ w > 0 s_i \cdot w > 0 s i ⋅ w > 0 일 때)
Birkhoff 다면체 (이중 확률 행렬) 위의 이차 정규화∞-구 위의 이차 및 선형 정규화차원 범위: n ∈ [ 10 3 , 10 4 ] n \in [10^3, 10^4] n ∈ [ 1 0 3 , 1 0 4 ] 각 ( n , ε ) (n, \varepsilon) ( n , ε ) 쌍에 대해 20번의 독립 시행 정확한 정규화 실패 확률 P ( ER c ( ε ) ) P(\text{ER}^c(\varepsilon)) P ( ER c ( ε )) 예상 정규화 임계값 E [ ε ˉ ] E[\bar{\varepsilon}] E [ ε ˉ ] 이론적 경계와 경험적 관찰의 비교 이론적 예측:
실패 확률 경계: P ( ER c ( ε ) ) ≤ 1 2 ε 2 n + ε n 3 / 4 P(\text{ER}^c(\varepsilon)) \leq \frac{1}{2}\varepsilon^2\sqrt{n} + \varepsilon n^{3/4} P ( ER c ( ε )) ≤ 2 1 ε 2 n + ε n 3/4 예상 임계값 하한: E [ ε ˉ ] ≥ 1 − e − 4 n 2 n 3 / 4 E[\bar{\varepsilon}] \geq \frac{1-e^{-4n}}{2n^{3/4}} E [ ε ˉ ] ≥ 2 n 3/4 1 − e − 4 n 실험 검증:
수평선 ε n 3 / 4 = 2 \varepsilon n^{3/4} = 2 ε n 3/4 = 2 에서의 경험적 실패 확률은 약 0.5이며, 이론적 경계 0.875와 일치합니다 스케일링 관계는 로그 스케일에서 직선으로 나타나 차원 의존성을 확인합니다 이차 정규화 :
이론적 경계: P ( ER c ( ε ) ) ≤ ε n + 1 2 ε 2 n P(\text{ER}^c(\varepsilon)) \leq \varepsilon n + \frac{1}{2}\varepsilon^2 n P ( ER c ( ε )) ≤ ε n + 2 1 ε 2 n ε < n − 1 \varepsilon < n^{-1} ε < n − 1 일 때, 첫 번째 항이 지배적이며 경계는 상수 인수 2 π e \sqrt{2\pi e} 2 π e 내에서 최적입니다선형 정규화 :
경계 방법은 더 타이트한 경계를 제공합니다: P ( ER c ( ε ) ) ≤ 1 2 π ε ∥ p ∥ 1 exp ( ε n − 1 ∥ p ∥ ) P(\text{ER}^c(\varepsilon)) \leq \frac{1}{\sqrt{2\pi}}\varepsilon\|p\|_1 \exp(\varepsilon\sqrt{n-1}\|p\|) P ( ER c ( ε )) ≤ 2 π 1 ε ∥ p ∥ 1 exp ( ε n − 1 ∥ p ∥ ) 거의 희소 벡터 p p p (비율 ∥ p ∥ 1 / ( n ∥ p ∥ ) \|p\|_1/(\sqrt{n}\|p\|) ∥ p ∥ 1 / ( n ∥ p ∥ ) 로 정량화)에 더 효과적입니다 명제 4.1 은 ∞-구 위의 하한을 증명합니다:
P ( ER c ( ε ) ) ≥ 1 − exp ( − 2 π e n ε ) P(\text{ER}^c(\varepsilon)) \geq 1 - \exp\left(-\sqrt{\frac{2}{\pi e}}n\varepsilon\right) P ( ER c ( ε )) ≥ 1 − exp ( − π e 2 n ε ) ε ≤ ( π e ) / 2 ⋅ 1 2 n \varepsilon \leq \sqrt{(\pi e)/2} \cdot \frac{1}{2n} ε ≤ ( π e ) /2 ⋅ 2 n 1 일 때, P ( ER c ( ε ) ) ≥ 1 2 π e n ε P(\text{ER}^c(\varepsilon)) \geq \frac{1}{\sqrt{2\pi e}}n\varepsilon P ( ER c ( ε )) ≥ 2 π e 1 n ε 입니다.
Mangasarian과 Meyer 1979 : 기본 조건 확립 Friedlander와 Tseng 2008 : 일반 볼록 계획법의 특성화 쌍대 선택 문제 P ψ \text{P}_\psi P ψ 를 통한 임계값 ε ˉ \bar{\varepsilon} ε ˉ 특성화 Cuturi 2013 : 엔트로피 정규화의 Sinkhorn 알고리즘 González-Sanz와 Nutz 2024 : 이차 정규화의 정확성 본 논문은 그들의 경계 E [ ε ˉ ] ≥ c / ( 4 n 2 ) E[\bar{\varepsilon}] \geq c/(4n^2) E [ ε ˉ ] ≥ c / ( 4 n 2 ) 를 E [ ε ˉ ] ≥ 1 / ( 4 n ) E[\bar{\varepsilon}] \geq 1/(4n) E [ ε ˉ ] ≥ 1/ ( 4 n ) 으로 개선합니다 사전 구조 가정이 필요하며, 다양한 영역에 적용됩니다 차원 스케일링 법칙 : 정확한 정규화 임계값은 명확한 차원 의존성을 가집니다(예: ∝ n − 3 / 4 \propto n^{-3/4} ∝ n − 3/4 (Birkhoff 다면체), ∝ n − 1 \propto n^{-1} ∝ n − 1 (∞-구))기하학적 연결 : 법선 원뿔 부채꼴의 가우스 측도를 통해 정확한 정규화와 다면체 기하학 사이의 깊은 연결을 확립합니다소프트 상전이 : 명확한 상전이 임계값이 존재하며, 작은 ε \varepsilon ε 에서는 높은 확률로 성공하고 큰 ε \varepsilon ε 에서는 높은 확률로 실패합니다다면체 제한 : 분석은 다면체 가능 영역으로 제한됩니다가우스 가정 : 비용 벡터는 가우스 분포여야 합니다계산 복잡성 : 일부 경계는 모든 꼭짓점의 법선 원뿔 계산이 필요합니다해 거리 경계 : 정확한 정규화가 실패할 때 dist ( x ε , Sol ( P 0 ) ) \text{dist}(x_\varepsilon, \text{Sol}(\text{P}_0)) dist ( x ε , Sol ( P 0 )) 의 확률 경계지지 단조성 : 이차 제약 정규화 LP에서 지지 단조성의 확률 정량화일반 원뿔 계획법 : 이차 및 반정부호 제약으로 확장이론적 혁신 : 정확한 정규화의 첫 번째 평균 경우 분석으로 중요한 이론적 공백을 채웁니다기술적 깊이 : 이동된 원뿔 가우스 측도의 양측 경계는 핵심 기술 기여입니다실용적 가치 : 정규화된 최적 수송 등의 응용에 계산 가능한 경계를 제공합니다기하학적 통찰 : 정확한 정규화와 다면체 기하학 사이의 깊은 연결을 드러냅니다실험 검증 : 수치 실험이 이론적 예측을 충분히 검증합니다적용 범위 : 다면체 제약과 가우스 비용 벡터로 제한됩니다상수 최적화 : 일부 경계의 상수가 충분히 타이트하지 않을 수 있습니다계산 복잡성 : 실제 응용에서 모든 꼭짓점 법선 원뿔 계산이 어려울 수 있습니다이론적 기여 : 확률적 선형계획법 이론에 새로운 도구를 제공합니다응용 가치 : 최적 수송 및 희소 최적화에 실제 지도 가치가 있습니다방법론 : 이동된 원뿔 분석 기법은 다른 문제로 일반화될 수 있습니다정규화 효과를 이해해야 하는 선형계획법 응용 최적 수송에서의 정규화 매개변수 선택 고차원 선형계획법의 견고성 분석 희소 최적화에서의 정확 복구 보장 본 논문은 36편의 관련 문헌을 인용하며, 주요 내용은 다음을 포함합니다:
고전적 볼록 최적화 이론(Rockafellar, Hiriart-Urruty & Lemaréchal) 정확 정규화 이론(Mangasarian & Meyer, Friedlander & Tseng) 최적 수송(Cuturi, González-Sanz & Nutz) 고차원 확률(Vershynin, Ledoux & Talagrand)