In this paper, we propose a novel extrapolation coefficient scheme within a new extrapolation term and develop an accelerated proximal gradient algorithm. We establish that the algorithm achieves a sublinear convergence rate. The proposed scheme only requires the Lipschitz constant estimate sequence to satisfy mild initial conditions, under which a key equality property can be derived to support the convergence analysis. Numerical experiments are provided to demonstrate the effectiveness and practical performance of the proposed method.
- ID Articolo: 2507.06737
- Titolo: Fast Accelerated Proximal Gradient Method with New Extrapolation Term for Multiobjective Optimization
- Autore: Huang Chengzhi
- Classificazione: math.OC (Ottimizzazione e Controllo)
- Data di Pubblicazione: 17 ottobre 2025
- Link Articolo: https://arxiv.org/abs/2507.06737
Questo articolo propone un nuovo schema di coefficienti di estrapolazione e un termine di estrapolazione innovativo, sviluppando un algoritmo del gradiente prossimale accelerato. L'algoritmo raggiunge un tasso di convergenza sublineare. Lo schema proposto richiede solo che la sequenza di stime delle costanti di Lipschitz soddisfi condizioni iniziali moderate, sotto le quali è possibile derivare proprietà di uguaglianza critiche per supportare l'analisi di convergenza. Gli esperimenti numerici verificano l'efficacia e le prestazioni pratiche del metodo proposto.
- Problema da risolvere: Problemi di ottimizzazione multiobjective, in particolare problemi compositi senza vincoli multiobjective:
minx∈RnF(x)≡(f1(x)+g1(x),…,fm(x)+gm(x))T
dove fi sono funzioni convesse lisce e gi sono funzioni convesse (potenzialmente non lisce).
- Importanza del problema: L'ottimizzazione multiobjective è ampiamente presente nelle applicazioni pratiche, come il ripristino di immagini e la compressione percettiva. Questi problemi generalmente non hanno una soluzione ottimale unica, ma piuttosto un insieme di soluzioni costituito da soluzioni Pareto ottimali.
- Limitazioni dei metodi esistenti:
- Tanabe et al. hanno esteso FISTA all'ottimizzazione multiobjective, raggiungendo un tasso di convergenza O(1/k2)
- I lavori di Sonntag et al. e Zhang et al. presentano prove teoriche incomplete, con analisi di convergenza che dipendono dalla non negatività della funzione ausiliaria σ(z)=mini=1,…,mFi(xk)−Fi(z), una condizione difficile da garantire
- Motivazione della ricerca: Superare i difetti nell'analisi teorica dei metodi esistenti, proporre un metodo con requisiti più moderati per le stime iniziali delle costanti di Lipschitz, ed evitare la dipendenza dalla non negatività di σ attraverso uguaglianze critiche.
- Propone un nuovo schema di termine di estrapolazione: Utilizza la forma di estrapolazione yk=xk+k+α−1k+α−4(xk−xk−1), dove α≥3
- Stabilisce condizioni iniziali moderate: Richiede solo che la sequenza di stime delle costanti di Lipschitz soddisfi condizioni iniziali più deboli
- Deriva proprietà di uguaglianza critiche: Evita la dipendenza dalla non negatività della funzione ausiliaria, perfezionando l'analisi teorica
- Prova il tasso di convergenza sublineare: Raggiunge un tasso di convergenza O(1/k2) nel caso liscio e O(1/k) nel caso non liscio
- Estende al caso non liscio: Gestisce problemi di ottimizzazione multiobjective completamente non lisci attraverso tecniche di lisciamento
Consideriamo il problema composito di ottimizzazione multiobjective senza vincoli (MOP):
minx∈RnF(x)=(f1(x)+g1(x),…,fm(x)+gm(x))T
dove:
- fi:Rn→R sono funzioni convesse continuamente differenziabili
- gi:Rn→R sono funzioni convesse (potenzialmente non lisce)
- L'obiettivo è trovare soluzioni debolmente Pareto ottimali
Sottoproblema principale:
minz∈RnϕL(f)(z;x,y)=maxi=1,…,m[⟨∇fi(y),z−y⟩+gi(z)+fi(y)−Fi(x)]+2L(f)∥z−y∥2
Passi dell'algoritmo:
- Calcola il punto di estrapolazione: yk=xk+k+α−1k+α−4(xk−xk−1)
- Risolvi il sottoproblema: xk+1=psk(xk,yk)
- Aggiorna i parametri: sk+1=ηsk, dove η=(k+α−1)(k+α−3)(k+α−2)2
Condizioni sui parametri:
- Quando α>3: 0<α−3α−2s0<L(f)1
- Quando α=3: 0<s0<L(f)1
Approssima le funzioni non lisce fi(x) attraverso funzioni lisciate f~i(x,μ), dove la funzione lisciata soddisfa:
- Differenziabilità continua: Per μ>0 fissato, f~(⋅,μ) è continuamente differenziabile
- Consistenza: limz→x,μ↓0f~(z,μ)=f(x)
- Consistenza del gradiente: {limz→x,μ↓0∇f~(z,μ)}⊆∂f(x)
- Nuovo design dei coefficienti di estrapolazione: Attraverso uno specifico metodo di aggiornamento dei parametri η=(k+α−1)(k+α−3)(k+α−2)2 si assicura che sk<L(f)1 valga sempre
- Derivazione di uguaglianze critiche: Attraverso manipolazioni algebriche intelligenti e scelta dei parametri, evita la dipendenza dalla non negatività di σk(z)
- Framework unificato: Quando α=3 degenera ai metodi esistenti, ma fornisce un'analisi teorica più completa
L'articolo menziona esperimenti numerici su tre problemi di ottimizzazione con tre obiettivi:
- Problema BK1&ℓ1
- Problema JOS1&ℓ1
- Problema SP1&ℓ1
Utilizza la funzione di merito u0(x)=supz∈Rnmini=1,…,m[Fi(x)−Fi(z)] per valutare le prestazioni dell'algoritmo, che soddisfa:
- u0(x)≥0 per tutti gli x
- x è debolmente Pareto ottimale se e solo se u0(x)=0
- Criterio di arresto: ∥xk−xk+1∥<ε
- Per il caso non liscio è inoltre richiesto μk<ε
- Aggiornamento dei parametri: μk+1=k+α−1k+α−2μk, sk+1=k+α−3k+α−2sk
L'articolo presenta grafici della frontiera di Pareto per tre problemi di ottimizzazione con tre obiettivi, ma i risultati numerici specifici e i dati di confronto delle prestazioni nel documento fornito non sono completi.
Caso Liscio (Theorem 4.3):
u0(xk)≤2(k+α−1)2L(f)(α−1)2R
raggiunge un tasso di convergenza O(1/k2).
Caso Non Liscio (Theorem 6.2):
u0(xk+1)≤O(k1)
raggiunge un tasso di convergenza O(1/k).
- Estensione FISTA multiobjective: Tanabe et al. hanno esteso per primi FISTA all'ottimizzazione multiobjective, raggiungendo un tasso di convergenza O(1/k2)
- Varianti monotone: Nishimura et al. hanno proposto una variante monotona di FISTA multiobjective
- Framework generalizzato: Tanabe et al. hanno esteso il framework a problemi a singolo obiettivo introducendo iperparametri
- Schemi di tipo Nesterov: Sonntag et al. e Zhang et al. hanno tentato di utilizzare termini di estrapolazione più efficienti, ma con analisi teorica incompleta
- Metodi non lisci: Gebken et al. hanno proposto algoritmi di discesa del sottogradiente per l'ottimizzazione multiobjective non liscia
- Propone un metodo del gradiente prossimale accelerato con nuovo termine di estrapolazione, applicabile all'ottimizzazione multiobjective liscia e non liscia
- Stabilisce una teoria di convergenza completa, evitando i difetti teorici dei metodi esistenti
- Raggiunge un tasso di convergenza O(1/k2) nel caso liscio e O(1/k) nel caso non liscio
- Parte sperimentale insufficiente: I risultati degli esperimenti numerici sono presentati in modo incompleto, mancano confronti dettagliati delle prestazioni
- Restrizioni nella scelta dei parametri: Requisiti specifici per i parametri iniziali s0 e α
- Tasso di convergenza più lento nel caso non liscio: Rispetto al caso liscio, la versione non liscia ha un tasso di convergenza ridotto a O(1/k)
- Esplorare tecniche di lisciamento migliori per migliorare il tasso di convergenza nel caso non liscio
- Ricercare strategie di scelta adattiva dei parametri
- Estendere a problemi di ottimizzazione multiobjective con vincoli
- Contributi teorici significativi: Risolve i difetti critici nell'analisi teorica dei metodi esistenti, fornendo prove di convergenza complete
- Design del metodo intelligente: Attraverso strategie specifiche di aggiornamento dei parametri assicura le garanzie teoriche dell'algoritmo
- Unità del framework: Incorpora i casi liscio e non liscio in un framework unificato
- Rigore matematico: Il processo di prova è dettagliato e la logica è chiara
- Verifica sperimentale insufficiente: La parte degli esperimenti numerici è troppo semplice, mancano confronti dettagliati con altri metodi avanzati
- Analisi di praticità carente: Manca un'analisi approfondita della complessità computazionale e degli scenari di applicazione pratica
- Sensibilità ai parametri non discussa: Non analizza l'impatto della scelta dei parametri sulle prestazioni dell'algoritmo
- Valore teorico elevato: Fornisce una base teorica più completa per i metodi accelerati di ottimizzazione multiobjective
- Valore pratico da verificare: Richiede più esperimenti per verificare l'efficacia in problemi reali
- Buona riproducibilità: La descrizione dell'algoritmo è chiara e l'analisi teorica è completa
- Problemi di ottimizzazione multiobjective con struttura composita
- Campi applicativi come l'elaborazione di immagini e la compressione percettiva
- Scenari di ottimizzazione che richiedono garanzie teoriche
L'articolo cita letteratura importante nel campo dell'ottimizzazione multiobjective, incluso:
- Lavori pioneristici di Tanabe et al. su FISTA multiobjective
- Teoria correlata dei metodi di accelerazione di Nesterov
- Letteratura correlata sulle tecniche di lisciamento
- Fondamenti teorici classici dell'ottimizzazione multiobjective
Valutazione Complessiva: Questo è un articolo con contributi teorici eccezionali che risolve con successo i difetti teorici nei metodi accelerati di gradiente prossimale multiobjective esistenti, fornendo un'analisi di convergenza completa. Tuttavia, l'articolo ha ancora spazio per miglioramenti nella verifica sperimentale e nell'analisi di praticità.