2025-11-17T11:43:13.229047

Average-case thresholds for exact regularization of linear programs

Friedlander, Kubal, Plan et al.
Small regularizers can preserve linear programming solutions exactly. This paper provides the first average-case analysis of exact regularization: with a standard Gaussian cost vector and fixed constraint set, bounds are established for the probability that exact regularization succeeds as a function of regularization strength. Failure is characterized via the Gaussian measure of inner cones, controlled by novel two-sided bounds on the measure of shifted cones. Results reveal dimension-dependent scaling laws and connect exact regularization of linear programs to their polyhedral geometry via the normal fan and the Gaussian (solid-angle) measure of its cones. Computable bounds are obtained in several canonical settings, including regularized optimal transport. Numerical experiments corroborate the predicted scalings and thresholds.
academic

Umbrales de caso promedio para regularización exacta de programas lineales

Información Básica

  • ID del Artículo: 2510.13083
  • Título: Average-case thresholds for exact regularization of linear programs
  • Autores: Michael P. Friedlander, Sharvaj Kubal, Yaniv Plan, Matthew S. Scott
  • Clasificación: math.OC cs.NA math.NA math.PR
  • Fecha de Publicación: 15 de octubre de 2025
  • Enlace del Artículo: https://arxiv.org/abs/2510.13083

Resumen

Los regularizadores pequeños pueden preservar exactamente las soluciones de programas lineales. Este artículo proporciona el primer análisis de caso promedio para regularización exacta: bajo vectores de costo gaussianos estándar y conjuntos de restricciones fijos, se establecen límites sobre la probabilidad de éxito de la regularización exacta con respecto a la intensidad de regularización. El fracaso se caracteriza mediante la medida gaussiana del cono interior, controlada por nuevos límites bilaterales de medidas de conos desplazados. Los resultados revelan leyes de escalado dependientes de la dimensión y vinculan la regularización exacta de programas lineales con su geometría poliédrica a través del abanico de conos normales y las medidas gaussianas (ángulo sólido) de sus conos. Se obtienen límites computables en varios escenarios típicos, incluyendo transporte óptimo regularizado. Los experimentos numéricos confirman los escalados y umbrales predichos.

Antecedentes y Motivación de la Investigación

Definición del Problema

El problema central estudiado en este artículo es el fenómeno de regularización exacta: para el problema de programación lineal (P0)min{gxAxb}\text{(P0)} \quad \min \{-g \cdot x | Ax \leq b\} y su versión regularizada (Pε)min{gx+εψ(x)Axb}\text{(P}_\varepsilon\text{)} \quad \min \{-g \cdot x + \varepsilon\psi(x) | Ax \leq b\} cuando el parámetro de regularización ε\varepsilon es suficientemente pequeño, la solución del problema regularizado sigue siendo una solución del problema original, es decir, Sol(Pε)Sol(P0)\text{Sol}(\text{P}_\varepsilon) \subseteq \text{Sol}(\text{P}_0).

Motivación de la Investigación

  1. Desafíos Computacionales: Los programas lineales pueden tener soluciones no únicas y sensibilidad extrema a perturbaciones de datos; la regularización puede mitigar estos problemas
  2. Vacío Teórico: El análisis determinista existente requiere resolver primero el problema original para determinar el umbral de regularización exacta εˉ\bar{\varepsilon}
  3. Necesidades Prácticas: En aplicaciones como transporte óptimo, la regularización cuadrática preserva mejor la dispersidad que la regularización entrópica
  4. Perspectivas Geométricas: El análisis probabilístico revela conexiones profundas entre regularización exacta y geometría poliédrica

Limitaciones de Métodos Existentes

  • La teoría determinista de Mangasarian y Meyer requiere resolver simultáneamente P0 y el problema de selección P_ψ
  • Los límites de González-Sanz y Nutz son demasiado holgados en caso promedio (mejora de factor n)
  • Falta análisis de leyes de escalado dependientes de la dimensión

Contribuciones Principales

  1. Límites de Medida Gaussiana de Conos Desplazados: Se establece el Teorema 1.3, proporcionando límites bilaterales de la medida gaussiana del cono V+w
  2. Caracterización Geométrica: Se prueba que la probabilidad de regularización exacta es igual a la suma de medidas gaussianas de conos interiores en todos los vértices (Teorema 1.5)
  3. Suite de Límites de Conos Interiores: Se desarrollan límites comprehensivos a través de condiciones de membresía (Teorema 2.1) y vectores de representación (Teorema 2.5)
  4. Análisis de Conjuntos Marginales: Se proporcionan límites bilaterales de conjuntos marginales mediante estructura de caras (Lema 3.2, Teorema 3.3)
  5. Aplicaciones Concretas: Se proporcionan límites óptimos (hasta constantes) para restricciones de bola-∞ y transporte óptimo regularizado

Detalles de la Metodología

Definición de la Tarea

Dado un dominio factible poliédrico Q={xRnAxb}Q = \{x \in \mathbb{R}^n | Ax \leq b\} y una función de regularización ψ\psi, se analiza la probabilidad del evento de regularización exacta ER(ε)\text{ER}(\varepsilon) cuando el vector de costo gN(0,In)g \sim N(0, I_n).

Marco Geométrico Principal

Estructura de Conos Normales y Vértices

Para xQx \in Q, el cono normal se define como: N(x):={vRnv(yx)0 para todo yQ}N(x) := \{v \in \mathbb{R}^n | v \cdot (y-x) \leq 0 \text{ para todo } y \in Q\}

Propiedades clave (Proposición 1.1):

  • N(z)N(z) es nn-dimensional si y solo si zVert(Q)z \in \text{Vert}(Q)
  • Los conos normales en vértices casi particionan todo el espacio: zVert(Q)N(z)=Rn\bigcup_{z \in \text{Vert}(Q)} N(z) = \mathbb{R}^n

Condiciones de Optimalidad

  • Optimalidad de P0: gN(z)g \in N(z)
  • Optimalidad de P_ε: gN(z)+(εψ)(z)g \in N(z) + \partial(\varepsilon\psi)(z)

Análisis de Medida Gaussiana de Conos Desplazados

Teorema 1.3 (Resultado Técnico Principal): Para un cono VRdV \subseteq \mathbb{R}^d y un vector wRdw \in \mathbb{R}^d, γ(V+w)[γ(V)exp(12w2dist(w,V)d),γ(V)exp(12ΠVw2+dist(w,V)d)]\gamma(V + w) \in \left[\gamma(V) \exp\left(-\frac{1}{2}\|w\|^2 - \text{dist}(w, -V^*)\sqrt{d}\right), \gamma(V) \exp\left(-\frac{1}{2}\|\Pi_{V^*}w\|^2 + \text{dist}(w, V^*)\sqrt{d}\right)\right]

Técnicas de Prueba:

  • Límite superior: Uso de desigualdad de Hölder y dualidad débil, optimizando el parámetro de varianza κ\kappa
  • Límite inferior: Desigualdad de Jensen combinada con descomposición de Moreau

Método de Análisis de Conos Interiores

Método de Condición de Membresía (Teorema 2.1)

Cuando (εψ)(z)N(z)\partial(\varepsilon\psi)(z) \cap N(z) \neq \emptyset, el cono interior se simplifica a N(z)+wN(z) + w, aplicando directamente el Teorema 1.3.

Método de Vectores de Representación (Teorema 2.5)

Para casos que no satisfacen la condición de membresía, se construye un vector de representación w~=ST1(STw)+\tilde{w} = S_T^{-1}(S_T w)_+, tal que: M(T,w)=M(T,w~)M(T, w) = M(T, \tilde{w}) donde M(T,w)=T(T+w)M(T, w) = T \setminus (T + w) es el conjunto marginal.

Descomposición de Caras del Conjunto Marginal

Lema 3.1: El conjunto marginal puede descomponerse como γ(M(T,w))i=1γ(Pi)\gamma(M(T, w)) \leq \sum_{i=1}^\ell \gamma(P^i) donde Pi=t[0,1)[Ti+tw]P^i = \bigcup_{t \in [0,1)} [T^i + tw] (cuando siw>0s_i \cdot w > 0).

Configuración Experimental

Escenarios de Verificación Numérica

  1. Politopo de Birkhoff (matrices doblemente estocásticas) con regularización cuadrática
  2. Bola-∞ con regularización cuadrática y lineal
  3. Rango de dimensiones: n[103,104]n \in [10^3, 10^4]
  4. 20 ensayos independientes para cada par (n,ε)(n, \varepsilon)

Métricas de Evaluación

  • Probabilidad de fracaso de regularización exacta P(ERc(ε))P(\text{ER}^c(\varepsilon))
  • Umbral de regularización esperado E[εˉ]E[\bar{\varepsilon}]
  • Comparación de límites teóricos con observaciones empíricas

Resultados Experimentales

Regularización Cuadrática en Politopo de Birkhoff

Predicciones Teóricas:

  • Límite de probabilidad de fracaso: P(ERc(ε))12ε2n+εn3/4P(\text{ER}^c(\varepsilon)) \leq \frac{1}{2}\varepsilon^2\sqrt{n} + \varepsilon n^{3/4}
  • Límite inferior del umbral esperado: E[εˉ]1e4n2n3/4E[\bar{\varepsilon}] \geq \frac{1-e^{-4n}}{2n^{3/4}}

Verificación Experimental:

  • La probabilidad de fracaso empírica en la curva horizontal εn3/4=2\varepsilon n^{3/4} = 2 es aproximadamente 0.5, consistente con el límite teórico de 0.875
  • La relación de escalado aparece como una línea recta en escala logarítmica, confirmando la dependencia dimensional

Análisis de Restricción de Bola-∞

Regularización Cuadrática:

  • Límite teórico: P(ERc(ε))εn+12ε2nP(\text{ER}^c(\varepsilon)) \leq \varepsilon n + \frac{1}{2}\varepsilon^2 n
  • Cuando ε<n1\varepsilon < n^{-1}, el primer término domina; el límite es óptimo dentro de factor constante 2πe\sqrt{2\pi e}

Regularización Lineal:

  • El método marginal proporciona límites más ajustados: P(ERc(ε))12πεp1exp(εn1p)P(\text{ER}^c(\varepsilon)) \leq \frac{1}{\sqrt{2\pi}}\varepsilon\|p\|_1 \exp(\varepsilon\sqrt{n-1}\|p\|)
  • Más efectivo para vectores casi dispersos pp (cuantificados por la razón p1/(np)\|p\|_1/(\sqrt{n}\|p\|))

Verificación de Límites Inferiores

Proposición 4.1 prueba límites inferiores en bola-∞: P(ERc(ε))1exp(2πenε)P(\text{ER}^c(\varepsilon)) \geq 1 - \exp\left(-\sqrt{\frac{2}{\pi e}}n\varepsilon\right) Para ε(πe)/212n\varepsilon \leq \sqrt{(\pi e)/2} \cdot \frac{1}{2n}, se tiene P(ERc(ε))12πenεP(\text{ER}^c(\varepsilon)) \geq \frac{1}{\sqrt{2\pi e}}n\varepsilon.

Trabajo Relacionado

Teoría Determinista de Regularización Exacta

  • Mangasarian y Meyer 1979: Establecen condiciones fundamentales
  • Friedlander y Tseng 2008: Caracterización para programación convexa general
  • Caracterización del umbral εˉ\bar{\varepsilon} a través del problema dual de selección Pψ\text{P}_\psi

Transporte Óptimo Regularizado

  • Cuturi 2013: Algoritmo Sinkhorn con regularización entrópica
  • González-Sanz y Nutz 2024: Exactitud de regularización cuadrática
  • Este artículo mejora su límite E[εˉ]c/(4n2)E[\bar{\varepsilon}] \geq c/(4n^2) a E[εˉ]1/(4n)E[\bar{\varepsilon}] \geq 1/(4n)

Regularización Exacta en Recuperación Dispersa y de Bajo Rango

  • Requiere suposiciones de estructura previa, aplicable a diferentes regímenes

Conclusiones y Discusión

Conclusiones Principales

  1. Leyes de Escalado Dimensional: Los umbrales de regularización exacta exhiben dependencia dimensional clara, como n3/4\propto n^{-3/4} (politopo de Birkhoff) y n1\propto n^{-1} (bola-∞)
  2. Conexión Geométrica: Se establece una conexión profunda entre regularización exacta y geometría poliédrica a través de medidas gaussianas del abanico de conos normales
  3. Transición de Fase Suave: Existe un umbral de transición de fase claro, con alto éxito de probabilidad para ε\varepsilon pequeño y alto fracaso para ε\varepsilon grande

Limitaciones

  1. Restricción Poliédrica: El análisis se limita a dominios factibles poliédricos
  2. Suposición Gaussiana: El vector de costo debe ser distribuido gaussianamente
  3. Complejidad Computacional: Algunos límites requieren calcular conos normales de todos los vértices

Direcciones Futuras

  1. Límites de Distancia de Solución: Límites probabilísticos de dist(xε,Sol(P0))\text{dist}(x_\varepsilon, \text{Sol}(\text{P}_0)) cuando falla la regularización exacta
  2. Monotonicidad de Soporte: Cuantificación probabilística de monotonicidad de soporte en LP regularizado con restricciones cuadráticas
  3. Programación Cónica General: Extensión a programación con restricciones cuadráticas y semidefinidas

Evaluación Profunda

Fortalezas

  1. Innovación Teórica: Primer análisis de caso promedio para regularización exacta, llenando un vacío teórico importante
  2. Profundidad Técnica: Los límites bilaterales de medida gaussiana de conos desplazados son una contribución técnica principal
  3. Valor Práctico: Proporciona límites computables para aplicaciones como transporte óptimo regularizado
  4. Perspectivas Geométricas: Revela conexiones profundas entre regularización exacta y geometría poliédrica
  5. Verificación Experimental: Los experimentos numéricos verifican ampliamente las predicciones teóricas

Deficiencias

  1. Alcance de Aplicabilidad: Limitado a restricciones poliédricas y vectores de costo gaussianos
  2. Optimización de Constantes: Las constantes en algunos límites pueden no ser suficientemente ajustadas
  3. Complejidad Computacional: El cálculo de conos normales de todos los vértices puede ser difícil en aplicaciones prácticas

Impacto

  1. Contribución Teórica: Proporciona nuevas herramientas para la teoría de programación lineal estocástica
  2. Valor de Aplicación: Tiene significado práctico para transporte óptimo y optimización dispersa
  3. Metodología: Las técnicas de análisis de conos desplazados pueden generalizarse a otros problemas

Escenarios de Aplicabilidad

  1. Aplicaciones de programación lineal donde se necesita comprender el efecto de regularización
  2. Selección de parámetros de regularización en transporte óptimo
  3. Análisis de robustez de programación lineal de alta dimensión
  4. Garantías de recuperación exacta en optimización dispersa

Referencias

Este artículo cita 36 referencias relacionadas, incluyendo principalmente:

  • Teoría clásica de optimización convexa (Rockafellar, Hiriart-Urruty & Lemaréchal)
  • Teoría de regularización exacta (Mangasarian & Meyer, Friedlander & Tseng)
  • Transporte óptimo (Cuturi, González-Sanz & Nutz)
  • Probabilidad de alta dimensión (Vershynin, Ledoux & Talagrand)