2025-11-17T11:43:13.229047

Average-case thresholds for exact regularization of linear programs

Friedlander, Kubal, Plan et al.

Small regularizers can preserve linear programming solutions exactly. This paper provides the first average-case analysis of exact regularization: with a standard Gaussian cost vector and fixed constraint set, bounds are established for the probability that exact regularization succeeds as a function of regularization strength. Failure is characterized via the Gaussian measure of inner cones, controlled by novel two-sided bounds on the measure of shifted cones. Results reveal dimension-dependent scaling laws and connect exact regularization of linear programs to their polyhedral geometry via the normal fan and the Gaussian (solid-angle) measure of its cones. Computable bounds are obtained in several canonical settings, including regularized optimal transport. Numerical experiments corroborate the predicted scalings and thresholds.

academic

Umbrales de caso promedio para regularización exacta de programas lineales

Información Básica

ID del Artículo: 2510.13083
Título: Average-case thresholds for exact regularization of linear programs
Autores: Michael P. Friedlander, Sharvaj Kubal, Yaniv Plan, Matthew S. Scott
Clasificación: math.OC cs.NA math.NA math.PR
Fecha de Publicación: 15 de octubre de 2025
Enlace del Artículo: https://arxiv.org/abs/2510.13083

Resumen

Los regularizadores pequeños pueden preservar exactamente las soluciones de programas lineales. Este artículo proporciona el primer análisis de caso promedio para regularización exacta: bajo vectores de costo gaussianos estándar y conjuntos de restricciones fijos, se establecen límites sobre la probabilidad de éxito de la regularización exacta con respecto a la intensidad de regularización. El fracaso se caracteriza mediante la medida gaussiana del cono interior, controlada por nuevos límites bilaterales de medidas de conos desplazados. Los resultados revelan leyes de escalado dependientes de la dimensión y vinculan la regularización exacta de programas lineales con su geometría poliédrica a través del abanico de conos normales y las medidas gaussianas (ángulo sólido) de sus conos. Se obtienen límites computables en varios escenarios típicos, incluyendo transporte óptimo regularizado. Los experimentos numéricos confirman los escalados y umbrales predichos.

Antecedentes y Motivación de la Investigación

Definición del Problema

El problema central estudiado en este artículo es el fenómeno de regularización exacta: para el problema de programación lineal $\text{(P0)} \quad \min \{-g \cdot x | Ax \leq b\}$ y su versión regularizada $\text{(P}_\varepsilon\text{)} \quad \min \{-g \cdot x + \varepsilon\psi(x) | Ax \leq b\}$ cuando el parámetro de regularización $\varepsilon$ es suficientemente pequeño, la solución del problema regularizado sigue siendo una solución del problema original, es decir, $\text{Sol}(\text{P}_\varepsilon) \subseteq \text{Sol}(\text{P}_0)$ .

Motivación de la Investigación

Desafíos Computacionales: Los programas lineales pueden tener soluciones no únicas y sensibilidad extrema a perturbaciones de datos; la regularización puede mitigar estos problemas
Vacío Teórico: El análisis determinista existente requiere resolver primero el problema original para determinar el umbral de regularización exacta $\bar{\varepsilon}$
Necesidades Prácticas: En aplicaciones como transporte óptimo, la regularización cuadrática preserva mejor la dispersidad que la regularización entrópica
Perspectivas Geométricas: El análisis probabilístico revela conexiones profundas entre regularización exacta y geometría poliédrica

Limitaciones de Métodos Existentes

La teoría determinista de Mangasarian y Meyer requiere resolver simultáneamente P0 y el problema de selección P_ψ
Los límites de González-Sanz y Nutz son demasiado holgados en caso promedio (mejora de factor n)
Falta análisis de leyes de escalado dependientes de la dimensión

Contribuciones Principales

Límites de Medida Gaussiana de Conos Desplazados: Se establece el Teorema 1.3, proporcionando límites bilaterales de la medida gaussiana del cono V+w
Caracterización Geométrica: Se prueba que la probabilidad de regularización exacta es igual a la suma de medidas gaussianas de conos interiores en todos los vértices (Teorema 1.5)
Suite de Límites de Conos Interiores: Se desarrollan límites comprehensivos a través de condiciones de membresía (Teorema 2.1) y vectores de representación (Teorema 2.5)
Análisis de Conjuntos Marginales: Se proporcionan límites bilaterales de conjuntos marginales mediante estructura de caras (Lema 3.2, Teorema 3.3)
Aplicaciones Concretas: Se proporcionan límites óptimos (hasta constantes) para restricciones de bola-∞ y transporte óptimo regularizado

Detalles de la Metodología

Definición de la Tarea

Dado un dominio factible poliédrico $Q = \{x \in \mathbb{R}^n | Ax \leq b\}$ y una función de regularización $\psi$ , se analiza la probabilidad del evento de regularización exacta $\text{ER}(\varepsilon)$ cuando el vector de costo $g \sim N(0, I_n)$ .

Marco Geométrico Principal

Estructura de Conos Normales y Vértices

Para $x \in Q$ , el cono normal se define como: $N(x) := \{v \in \mathbb{R}^n | v \cdot (y-x) \leq 0 \text{ para todo } y \in Q\}$

Propiedades clave (Proposición 1.1):

$N(z)$ es $n$ -dimensional si y solo si $z \in \text{Vert}(Q)$
Los conos normales en vértices casi particionan todo el espacio: $\bigcup_{z \in \text{Vert}(Q)} N(z) = \mathbb{R}^n$

Condiciones de Optimalidad

Optimalidad de P0: $g \in N(z)$
Optimalidad de P_ε: $g \in N(z) + \partial(\varepsilon\psi)(z)$

Análisis de Medida Gaussiana de Conos Desplazados

Teorema 1.3 (Resultado Técnico Principal): Para un cono $V \subseteq \mathbb{R}^d$ y un vector $w \in \mathbb{R}^d$ , $\gamma(V + w) \in \left[\gamma(V) \exp\left(-\frac{1}{2}\|w\|^2 - \text{dist}(w, -V^*)\sqrt{d}\right), \gamma(V) \exp\left(-\frac{1}{2}\|\Pi_{V^*}w\|^2 + \text{dist}(w, V^*)\sqrt{d}\right)\right]$

Técnicas de Prueba:

Límite superior: Uso de desigualdad de Hölder y dualidad débil, optimizando el parámetro de varianza $\kappa$
Límite inferior: Desigualdad de Jensen combinada con descomposición de Moreau

Método de Análisis de Conos Interiores

Método de Condición de Membresía (Teorema 2.1)

Cuando $\partial(\varepsilon\psi)(z) \cap N(z) \neq \emptyset$ , el cono interior se simplifica a $N(z) + w$ , aplicando directamente el Teorema 1.3.

Método de Vectores de Representación (Teorema 2.5)

Para casos que no satisfacen la condición de membresía, se construye un vector de representación $\tilde{w} = S_T^{-1}(S_T w)_+$ , tal que: $M(T, w) = M(T, \tilde{w})$ donde $M(T, w) = T \setminus (T + w)$ es el conjunto marginal.

Descomposición de Caras del Conjunto Marginal

Lema 3.1: El conjunto marginal puede descomponerse como $\gamma(M(T, w)) \leq \sum_{i=1}^\ell \gamma(P^i)$ donde $P^i = \bigcup_{t \in [0,1)} [T^i + tw]$ (cuando $s_i \cdot w > 0$ ).

Configuración Experimental

Escenarios de Verificación Numérica

Politopo de Birkhoff (matrices doblemente estocásticas) con regularización cuadrática
Bola-∞ con regularización cuadrática y lineal
Rango de dimensiones: $n \in [10^3, 10^4]$
20 ensayos independientes para cada par $(n, \varepsilon)$

Métricas de Evaluación

Probabilidad de fracaso de regularización exacta $P(\text{ER}^c(\varepsilon))$
Umbral de regularización esperado $E[\bar{\varepsilon}]$
Comparación de límites teóricos con observaciones empíricas

Resultados Experimentales

Regularización Cuadrática en Politopo de Birkhoff

Predicciones Teóricas:

Límite de probabilidad de fracaso: $P(\text{ER}^c(\varepsilon)) \leq \frac{1}{2}\varepsilon^2\sqrt{n} + \varepsilon n^{3/4}$
Límite inferior del umbral esperado: $E[\bar{\varepsilon}] \geq \frac{1-e^{-4n}}{2n^{3/4}}$

Verificación Experimental:

La probabilidad de fracaso empírica en la curva horizontal $\varepsilon n^{3/4} = 2$ es aproximadamente 0.5, consistente con el límite teórico de 0.875
La relación de escalado aparece como una línea recta en escala logarítmica, confirmando la dependencia dimensional

Análisis de Restricción de Bola-∞

Regularización Cuadrática:

Límite teórico: $P(\text{ER}^c(\varepsilon)) \leq \varepsilon n + \frac{1}{2}\varepsilon^2 n$
Cuando $\varepsilon < n^{-1}$ , el primer término domina; el límite es óptimo dentro de factor constante $\sqrt{2\pi e}$

Regularización Lineal:

El método marginal proporciona límites más ajustados: $P(\text{ER}^c(\varepsilon)) \leq \frac{1}{\sqrt{2\pi}}\varepsilon\|p\|_1 \exp(\varepsilon\sqrt{n-1}\|p\|)$
Más efectivo para vectores casi dispersos $p$ (cuantificados por la razón $\|p\|_1/(\sqrt{n}\|p\|)$ )

Verificación de Límites Inferiores

Proposición 4.1 prueba límites inferiores en bola-∞: $P(\text{ER}^c(\varepsilon)) \geq 1 - \exp\left(-\sqrt{\frac{2}{\pi e}}n\varepsilon\right)$ Para $\varepsilon \leq \sqrt{(\pi e)/2} \cdot \frac{1}{2n}$ , se tiene $P(\text{ER}^c(\varepsilon)) \geq \frac{1}{\sqrt{2\pi e}}n\varepsilon$ .

Trabajo Relacionado

Teoría Determinista de Regularización Exacta

Mangasarian y Meyer 1979: Establecen condiciones fundamentales
Friedlander y Tseng 2008: Caracterización para programación convexa general
Caracterización del umbral $\bar{\varepsilon}$ a través del problema dual de selección $\text{P}_\psi$

Transporte Óptimo Regularizado

Cuturi 2013: Algoritmo Sinkhorn con regularización entrópica
González-Sanz y Nutz 2024: Exactitud de regularización cuadrática
Este artículo mejora su límite $E[\bar{\varepsilon}] \geq c/(4n^2)$ a $E[\bar{\varepsilon}] \geq 1/(4n)$

Regularización Exacta en Recuperación Dispersa y de Bajo Rango

Requiere suposiciones de estructura previa, aplicable a diferentes regímenes

Conclusiones y Discusión

Conclusiones Principales

Leyes de Escalado Dimensional: Los umbrales de regularización exacta exhiben dependencia dimensional clara, como $\propto n^{-3/4}$ (politopo de Birkhoff) y $\propto n^{-1}$ (bola-∞)
Conexión Geométrica: Se establece una conexión profunda entre regularización exacta y geometría poliédrica a través de medidas gaussianas del abanico de conos normales
Transición de Fase Suave: Existe un umbral de transición de fase claro, con alto éxito de probabilidad para $\varepsilon$ pequeño y alto fracaso para $\varepsilon$ grande

Limitaciones

Restricción Poliédrica: El análisis se limita a dominios factibles poliédricos
Suposición Gaussiana: El vector de costo debe ser distribuido gaussianamente
Complejidad Computacional: Algunos límites requieren calcular conos normales de todos los vértices

Direcciones Futuras

Límites de Distancia de Solución: Límites probabilísticos de $\text{dist}(x_\varepsilon, \text{Sol}(\text{P}_0))$ cuando falla la regularización exacta
Monotonicidad de Soporte: Cuantificación probabilística de monotonicidad de soporte en LP regularizado con restricciones cuadráticas
Programación Cónica General: Extensión a programación con restricciones cuadráticas y semidefinidas

Evaluación Profunda

Fortalezas

Innovación Teórica: Primer análisis de caso promedio para regularización exacta, llenando un vacío teórico importante
Profundidad Técnica: Los límites bilaterales de medida gaussiana de conos desplazados son una contribución técnica principal
Valor Práctico: Proporciona límites computables para aplicaciones como transporte óptimo regularizado
Perspectivas Geométricas: Revela conexiones profundas entre regularización exacta y geometría poliédrica
Verificación Experimental: Los experimentos numéricos verifican ampliamente las predicciones teóricas

Deficiencias

Alcance de Aplicabilidad: Limitado a restricciones poliédricas y vectores de costo gaussianos
Optimización de Constantes: Las constantes en algunos límites pueden no ser suficientemente ajustadas
Complejidad Computacional: El cálculo de conos normales de todos los vértices puede ser difícil en aplicaciones prácticas

Impacto

Contribución Teórica: Proporciona nuevas herramientas para la teoría de programación lineal estocástica
Valor de Aplicación: Tiene significado práctico para transporte óptimo y optimización dispersa
Metodología: Las técnicas de análisis de conos desplazados pueden generalizarse a otros problemas

Escenarios de Aplicabilidad

Aplicaciones de programación lineal donde se necesita comprender el efecto de regularización
Selección de parámetros de regularización en transporte óptimo
Análisis de robustez de programación lineal de alta dimensión
Garantías de recuperación exacta en optimización dispersa

Referencias

Este artículo cita 36 referencias relacionadas, incluyendo principalmente:

Teoría clásica de optimización convexa (Rockafellar, Hiriart-Urruty & Lemaréchal)
Teoría de regularización exacta (Mangasarian & Meyer, Friedlander & Tseng)
Transporte óptimo (Cuturi, González-Sanz & Nutz)
Probabilidad de alta dimensión (Vershynin, Ledoux & Talagrand)