2025-11-17T11:43:13.229047

Average-case thresholds for exact regularization of linear programs

Friedlander, Kubal, Plan et al.
Small regularizers can preserve linear programming solutions exactly. This paper provides the first average-case analysis of exact regularization: with a standard Gaussian cost vector and fixed constraint set, bounds are established for the probability that exact regularization succeeds as a function of regularization strength. Failure is characterized via the Gaussian measure of inner cones, controlled by novel two-sided bounds on the measure of shifted cones. Results reveal dimension-dependent scaling laws and connect exact regularization of linear programs to their polyhedral geometry via the normal fan and the Gaussian (solid-angle) measure of its cones. Computable bounds are obtained in several canonical settings, including regularized optimal transport. Numerical experiments corroborate the predicted scalings and thresholds.
academic

Soglie di caso medio per la regolarizzazione esatta di programmi lineari

Informazioni di base

  • ID articolo: 2510.13083
  • Titolo: Average-case thresholds for exact regularization of linear programs
  • Autori: Michael P. Friedlander, Sharvaj Kubal, Yaniv Plan, Matthew S. Scott
  • Classificazione: math.OC cs.NA math.NA math.PR
  • Data di pubblicazione: 15 ottobre 2025
  • Link articolo: https://arxiv.org/abs/2510.13083

Riassunto

Piccoli regolarizzatori possono preservare esattamente le soluzioni di programmi lineari. Questo articolo fornisce la prima analisi di caso medio della regolarizzazione esatta: sotto vettori di costo gaussiani standard e insiemi di vincoli fissi, vengono stabiliti limiti sulla probabilità di successo della regolarizzazione esatta in funzione dell'intensità di regolarizzazione. Il fallimento è caratterizzato dalla misura gaussiana del cono interno, controllato da nuovi limiti bilaterali della misura del cono traslato. I risultati rivelano leggi di scala dipendenti dalla dimensione e collegano la regolarizzazione esatta dei programmi lineari alla loro geometria poliedrica attraverso il ventaglio del cono normale e le misure gaussiane (angoli solidi) dei coni risultanti. Limiti calcolabili sono ottenuti in diversi contesti tipici, inclusa la regolarizzazione del trasporto ottimale. Gli esperimenti numerici confermano i tassi di scala e le soglie previste.

Contesto di ricerca e motivazione

Definizione del problema

Il problema centrale affrontato in questo articolo è il fenomeno della regolarizzazione esatta: per il problema di programmazione lineare (P0)min{gxAxb}\text{(P0)} \quad \min \{-g \cdot x | Ax \leq b\} e la sua versione regolarizzata (Pε)min{gx+εψ(x)Axb}\text{(P}_\varepsilon\text{)} \quad \min \{-g \cdot x + \varepsilon\psi(x) | Ax \leq b\} quando il parametro di regolarizzazione ε\varepsilon è sufficientemente piccolo, la soluzione del problema regolarizzato rimane una soluzione del problema originale, cioè Sol(Pε)Sol(P0)\text{Sol}(\text{P}_\varepsilon) \subseteq \text{Sol}(\text{P}_0).

Motivazione della ricerca

  1. Sfide computazionali: I programmi lineari possono avere soluzioni non uniche e sensibilità estrema alle perturbazioni dei dati; la regolarizzazione può mitigare questi problemi
  2. Lacune teoriche: L'analisi deterministica esistente richiede di risolvere prima il problema originale per determinare la soglia di regolarizzazione esatta εˉ\bar{\varepsilon}
  3. Esigenze pratiche: Nelle applicazioni come il trasporto ottimale, la regolarizzazione quadratica preserva meglio la sparsità rispetto alla regolarizzazione entropica
  4. Intuizioni geometriche: L'analisi probabilistica rivela connessioni profonde tra la regolarizzazione esatta e la geometria poliedrica

Limitazioni dei metodi esistenti

  • La teoria deterministica di Mangasarian e Meyer richiede di risolvere simultaneamente P0 e il problema di selezione P_ψ
  • I limiti di González-Sanz e Nutz sono troppo ampi nel caso medio (migliorati di un fattore n)
  • Manca un'analisi delle leggi di scala dipendenti dalla dimensione

Contributi principali

  1. Limiti della misura gaussiana del cono traslato: Stabilisce il Teorema 1.3, fornendo limiti bilaterali della misura gaussiana del cono V+w
  2. Caratterizzazione geometrica: Dimostra che la probabilità di regolarizzazione esatta è uguale alla somma delle misure gaussiane del cono interno in tutti i vertici (Teorema 1.5)
  3. Suite di limiti del cono interno: Sviluppa limiti completi attraverso condizioni di appartenenza (Teorema 2.1) e vettori di rappresentazione (Teorema 2.5)
  4. Analisi degli insiemi marginali: Fornisce limiti bilaterali degli insiemi marginali attraverso la struttura delle facce (Lemma 3.2, Teorema 3.3)
  5. Applicazioni concrete: Fornisce limiti ottimali (fino a costanti) per vincoli di sfera ∞ e trasporto ottimale regolarizzato

Dettagli metodologici

Definizione del compito

Dato un dominio fattibile poliedrico Q={xRnAxb}Q = \{x \in \mathbb{R}^n | Ax \leq b\} e una funzione di regolarizzazione ψ\psi, analizzare la probabilità dell'evento di regolarizzazione esatta ER(ε)\text{ER}(\varepsilon) quando il vettore di costo gN(0,In)g \sim N(0, I_n).

Struttura geometrica fondamentale

Coni normali e struttura dei vertici

Per xQx \in Q, il cono normale è definito come: N(x):={vRnv(yx)0 per tutti yQ}N(x) := \{v \in \mathbb{R}^n | v \cdot (y-x) \leq 0 \text{ per tutti } y \in Q\}

Proprietà chiave (Proposizione 1.1):

  • N(z)N(z) è nn-dimensionale se e solo se zVert(Q)z \in \text{Vert}(Q)
  • I coni normali ai vertici quasi partizionano l'intero spazio: zVert(Q)N(z)=Rn\bigcup_{z \in \text{Vert}(Q)} N(z) = \mathbb{R}^n

Condizioni di ottimalità

  • Ottimalità di P0: gN(z)g \in N(z)
  • Ottimalità di P_ε: gN(z)+(εψ)(z)g \in N(z) + \partial(\varepsilon\psi)(z)

Analisi della misura gaussiana del cono traslato

Teorema 1.3 (risultato tecnico centrale): Per un cono VRdV \subseteq \mathbb{R}^d e un vettore wRdw \in \mathbb{R}^d, γ(V+w)[γ(V)exp(12w2dist(w,V)d),γ(V)exp(12ΠVw2+dist(w,V)d)]\gamma(V + w) \in \left[\gamma(V) \exp\left(-\frac{1}{2}\|w\|^2 - \text{dist}(w, -V^*)\sqrt{d}\right), \gamma(V) \exp\left(-\frac{1}{2}\|\Pi_{V^*}w\|^2 + \text{dist}(w, V^*)\sqrt{d}\right)\right]

Tecniche di prova:

  • Limite superiore: Utilizza la disuguaglianza di Hölder e la dualità debole, ottimizzando il parametro di varianza κ\kappa
  • Limite inferiore: Disuguaglianza di Jensen combinata con la decomposizione di Moreau

Metodo di analisi del cono interno

Metodo delle condizioni di appartenenza (Teorema 2.1)

Quando (εψ)(z)N(z)\partial(\varepsilon\psi)(z) \cap N(z) \neq \emptyset, il cono interno si semplifica a N(z)+wN(z) + w, applicando direttamente il Teorema 1.3.

Metodo dei vettori di rappresentazione (Teorema 2.5)

Per i casi che non soddisfano la condizione di appartenenza, costruisce il vettore di rappresentazione w~=ST1(STw)+\tilde{w} = S_T^{-1}(S_T w)_+, tale che: M(T,w)=M(T,w~)M(T, w) = M(T, \tilde{w}) dove M(T,w)=T(T+w)M(T, w) = T \setminus (T + w) è l'insieme marginale.

Decomposizione per facce dell'insieme marginale

Lemma 3.1: L'insieme marginale può essere decomposto come γ(M(T,w))i=1γ(Pi)\gamma(M(T, w)) \leq \sum_{i=1}^\ell \gamma(P^i) dove Pi=t[0,1)[Ti+tw]P^i = \bigcup_{t \in [0,1)} [T^i + tw] (quando siw>0s_i \cdot w > 0).

Configurazione sperimentale

Scenari di verifica numerica

  1. Poliedro di Birkhoff (matrici doppiamente stocastiche) con regolarizzazione quadratica
  2. Sfera ∞ con regolarizzazione quadratica e lineare
  3. Intervallo di dimensioni: n[103,104]n \in [10^3, 10^4]
  4. 20 prove indipendenti per ogni coppia (n,ε)(n, \varepsilon)

Metriche di valutazione

  • Probabilità di fallimento della regolarizzazione esatta P(ERc(ε))P(\text{ER}^c(\varepsilon))
  • Soglia di regolarizzazione attesa E[εˉ]E[\bar{\varepsilon}]
  • Confronto tra limiti teorici e osservazioni empiriche

Risultati sperimentali

Regolarizzazione quadratica sul poliedro di Birkhoff

Previsioni teoriche:

  • Limite della probabilità di fallimento: P(ERc(ε))12ε2n+εn3/4P(\text{ER}^c(\varepsilon)) \leq \frac{1}{2}\varepsilon^2\sqrt{n} + \varepsilon n^{3/4}
  • Limite inferiore della soglia attesa: E[εˉ]1e4n2n3/4E[\bar{\varepsilon}] \geq \frac{1-e^{-4n}}{2n^{3/4}}

Verifica sperimentale:

  • La probabilità di fallimento empirica alla curva orizzontale εn3/4=2\varepsilon n^{3/4} = 2 è circa 0,5, coerente con il limite teorico di 0,875
  • La relazione di scala appare come una linea in scala logaritmica, confermando la dipendenza dalla dimensione

Analisi del vincolo di sfera ∞

Regolarizzazione quadratica:

  • Limite teorico: P(ERc(ε))εn+12ε2nP(\text{ER}^c(\varepsilon)) \leq \varepsilon n + \frac{1}{2}\varepsilon^2 n
  • Quando ε<n1\varepsilon < n^{-1}, il primo termine domina, il limite è ottimale entro il fattore costante 2πe\sqrt{2\pi e}

Regolarizzazione lineare:

  • Il metodo marginale fornisce limiti più stretti: P(ERc(ε))12πεp1exp(εn1p)P(\text{ER}^c(\varepsilon)) \leq \frac{1}{\sqrt{2\pi}}\varepsilon\|p\|_1 \exp(\varepsilon\sqrt{n-1}\|p\|)
  • Più efficace per vettori quasi sparsi pp (quantificati dal rapporto p1/(np)\|p\|_1/(\sqrt{n}\|p\|))

Verifica dei limiti inferiori

La Proposizione 4.1 dimostra i limiti inferiori sulla sfera ∞: P(ERc(ε))1exp(2πenε)P(\text{ER}^c(\varepsilon)) \geq 1 - \exp\left(-\sqrt{\frac{2}{\pi e}}n\varepsilon\right) Per ε(πe)/212n\varepsilon \leq \sqrt{(\pi e)/2} \cdot \frac{1}{2n}, si ha P(ERc(ε))12πenεP(\text{ER}^c(\varepsilon)) \geq \frac{1}{\sqrt{2\pi e}}n\varepsilon.

Lavori correlati

Teoria deterministica della regolarizzazione esatta

  • Mangasarian e Meyer 1979: Stabiliscono le condizioni fondamentali
  • Friedlander e Tseng 2008: Caratterizzazione per programmi convessi generali
  • Caratterizzazione della soglia εˉ\bar{\varepsilon} attraverso il problema di selezione duale Pψ\text{P}_\psi

Trasporto ottimale regolarizzato

  • Cuturi 2013: Algoritmo di Sinkhorn con regolarizzazione entropica
  • González-Sanz e Nutz 2024: Esattezza della regolarizzazione quadratica
  • Questo articolo migliora il loro limite E[εˉ]c/(4n2)E[\bar{\varepsilon}] \geq c/(4n^2) a E[εˉ]1/(4n)E[\bar{\varepsilon}] \geq 1/(4n)

Regolarizzazione esatta nel recupero sparso e a basso rango

  • Richiede assunzioni di struttura a priori, applicabile a diversi regimi

Conclusioni e discussione

Conclusioni principali

  1. Leggi di scala dipendenti dalla dimensione: La soglia di regolarizzazione esatta presenta una dipendenza dalla dimensione ben definita, come n3/4\propto n^{-3/4} (poliedro di Birkhoff) e n1\propto n^{-1} (sfera ∞)
  2. Connessione geometrica: Stabilisce connessioni profonde tra la regolarizzazione esatta e la geometria poliedrica attraverso la misura gaussiana del ventaglio del cono normale
  3. Transizione di fase morbida: Esiste una soglia di transizione di fase ben definita, con alto successo per piccoli ε\varepsilon e alto fallimento per grandi ε\varepsilon

Limitazioni

  1. Restrizione poliedrica: L'analisi è limitata a domini fattibili poliedrici
  2. Assunzione gaussiana: Il vettore di costo deve essere distribuito gaussianamente
  3. Complessità computazionale: Alcuni limiti richiedono il calcolo dei coni normali di tutti i vertici

Direzioni future

  1. Limiti sulla distanza della soluzione: Limiti probabilistici su dist(xε,Sol(P0))\text{dist}(x_\varepsilon, \text{Sol}(\text{P}_0)) quando la regolarizzazione esatta fallisce
  2. Monotonicità del supporto: Quantificazione della probabilità della monotonicità del supporto nella regolarizzazione LP con vincoli quadratici
  3. Programmi conici generali: Estensione a vincoli quadratici e semidefiniti

Valutazione approfondita

Punti di forza

  1. Innovazione teorica: Fornisce la prima analisi di caso medio della regolarizzazione esatta, colmando un'importante lacuna teorica
  2. Profondità tecnica: I limiti bilaterali della misura gaussiana del cono traslato rappresentano un contributo tecnico fondamentale
  3. Valore pratico: Fornisce limiti calcolabili per applicazioni come il trasporto ottimale regolarizzato
  4. Intuizioni geometriche: Rivela connessioni profonde tra la regolarizzazione esatta e la geometria poliedrica
  5. Verifica sperimentale: Gli esperimenti numerici verificano ampiamente le previsioni teoriche

Insufficienze

  1. Ambito di applicabilità: Limitato a vincoli poliedrici e vettori di costo gaussiani
  2. Ottimizzazione delle costanti: Le costanti in alcuni limiti potrebbero non essere sufficientemente strette
  3. Complessità computazionale: Nel calcolo pratico, il calcolo dei coni normali di tutti i vertici potrebbe essere difficile

Impatto

  1. Contributo teorico: Fornisce nuovi strumenti per la teoria della programmazione lineare stocastica
  2. Valore applicativo: Ha implicazioni pratiche significative per il trasporto ottimale e l'ottimizzazione sparsa
  3. Metodologia: La tecnica di analisi del cono traslato può essere generalizzata ad altri problemi

Scenari applicabili

  1. Applicazioni di programmazione lineare dove è necessario comprendere l'effetto della regolarizzazione
  2. Scelta del parametro di regolarizzazione nel trasporto ottimale
  3. Analisi di robustezza della programmazione lineare ad alta dimensione
  4. Garanzie di recupero esatto nell'ottimizzazione sparsa

Bibliografia

Questo articolo cita 36 lavori correlati, principalmente includenti:

  • Teoria classica dell'ottimizzazione convessa (Rockafellar, Hiriart-Urruty & Lemaréchal)
  • Teoria della regolarizzazione esatta (Mangasarian & Meyer, Friedlander & Tseng)
  • Trasporto ottimale (Cuturi, González-Sanz & Nutz)
  • Probabilità ad alta dimensione (Vershynin, Ledoux & Talagrand)