2025-11-20T05:43:14.076539

Inverse optimal design of input-to-state stabilizing homogeneous controllers for nonlinear homogeneous systems

Lu, Lyu, Yu

This work studies the inverse optimality of input-to-state stabilizing controllers with input-output stability guarantees for nonlinear homogeneous systems. We formulate a new inverse optimal control problem, where the cost functional incorporates penalties on the output, in addition to the state, control and disturbance as in current related works. One benefit of penalizing the output is that the resulting inverse optimal controllers can ensure both input-to-state stability and input-output stability. We propose a technique for constructing the corresponding meaningful cost functional by using homogeneity properties, and provide sufficient conditions on solving the inverse optimal gain assignment problem. We show that homogeneous stabilizability of homogeneous systems in the case without disturbance is sufficient for the solvability of inverse optimal gain assignment problem for homogeneous systems.

academic

Progettazione ottimale inversa di controllori omogenei stabilizzanti input-to-state per sistemi nonlineari omogenei

Informazioni Fondamentali

ID Articolo: 2511.15034
Titolo: Inverse optimal design of input-to-state stabilizing homogeneous controllers for nonlinear homogeneous systems
Autori: Kaixin Lu (National University of Singapore), Ziliang Lyu (Nanyang Technological University & Tongji University), Haoyong Yu (National University of Singapore)
Classificazione: eess.SY (Sistemi e Controllo), cs.SY
Data di Sottomissione: 19 novembre 2025
Link Articolo: https://arxiv.org/abs/2511.15034

Riassunto

Questo articolo affronta il problema dell'ottimalità inversa per controllori input-to-state stabilizing (ISS) di sistemi nonlineari omogenei, fornendo garanzie di stabilità input-output (IOS). L'articolo propone un nuovo problema di controllo ottimale inverso, in cui il funzionale di costo include una penalità sull'uscita oltre alle penalità tradizionali su stato, controllo e disturbi. Il vantaggio di questo approccio è che il controllore ottimale inverso risultante garantisce simultaneamente ISS e IOS. Gli autori sfruttano le proprietà di omogeneità per proporre tecniche di costruzione di funzionali di costo significativi e forniscono condizioni sufficienti per risolvere il problema di allocazione dei guadagni ottimali inversi. Lo studio dimostra che l'omogeneità stabilizzabile del sistema omogeneo senza disturbi è una condizione sufficiente per la risolvibilità del problema di allocazione dei guadagni ottimali inversi per sistemi omogenei.

Contesto di Ricerca e Motivazione

1. Problema Fondamentale da Risolvere

Il problema fondamentale affrontato in questo articolo è: come progettare controllori ottimali inversi che garantiscano simultaneamente la stabilità input-state (ISS) e la stabilità input-output (IOS), costruendo funzionali di costo significativi per essi.

2. Importanza del Problema

Vantaggi dell'Ottimalità: I controllori ottimali possiedono molte proprietà desiderabili, come margini di guadagno e robustezza. Il controllo ottimale inverso evita le difficoltà nella risoluzione dell'equazione di Hamilton-Jacobi-Isaacs (HJI).
Limitazioni dell'ISS: L'ISS descrive la relazione tra stato e disturbi dal punto di vista L∞, ma in alcuni sistemi di controllo (come il controllo adattativo modulare basato su identificatori passivi), è difficile garantire che "l'uscita di interesse" appartenga allo spazio L∞.
Necessità dell'IOS: Nei problemi di controllo pratico, dopo aver garantito l'ISS, è necessario comprendere come i disturbi di ingresso influenzano specifici segnali ad anello chiuso per realizzare l'attenuazione dei disturbi. Ad esempio, nel controllo H∞ nonlineare, è richiesta la stabilità con guadagno finito L2.

3. Limitazioni dei Metodi Esistenti

Lavoro Fondamentale di Krstic e Li 11: Ha proposto il framework di controllo ISS ottimale inverso, ma il suo funzionale di costo contiene solo penalità su stato, controllo e disturbi, senza penalità sull'uscita.
Mancanza di Garanzie IOS: Come mostrato nell'Esempio 1, i controllori ottimali inversi che non penalizzano l'uscita potrebbero non garantire l'IOS (come la stabilità L2).
Difficoltà di Costruzione: Quando l'uscita viene penalizzata, è difficile trovare funzionali di costo significativi, poiché i termini di penalità devono essere non-negativi su tutto lo spazio degli stati.

4. Motivazione della Ricerca

Vantaggi dell'Omogeneità: L'omogeneità può trasformare le proprietà locali del sistema in proprietà globali attraverso opportuni fattori di scala, fornendo uno strumento per superare le difficoltà sopra menzionate.
Esigenza Teorica: È necessario investigare secondo quale criterio di ottimalità i controllori ISS con garanzie IOS sono ottimali inversi.

Contributi Fondamentali

Nuovo Problema di Controllo Ottimale Inverso: Per la prima volta, viene proposto un problema di controllo ottimale inverso con penalità sull'uscita nel funzionale di costo (Definizione 7), in modo che il controllore ottimale inverso garantisca simultaneamente ISS e IOS.
Tecniche di Costruzione: Vengono proposte tecniche di costruzione di funzionali di costo significativi sfruttando le proprietà di omogeneità (Lemma 3 e Lemma 4), risolvendo in particolare il difficile problema di come scegliere il parametro κ e la funzione γ(s) per garantire che la penalità di stato l(x) sia definita positiva.
Condizioni Sufficienti: Nel Teorema 1 vengono fornite condizioni sufficienti per risolvere il problema di allocazione dei guadagni ottimali inversi, provando che il controllore progettato garantisce simultaneamente ISS e stabilità L2 con guadagno finito.
Risultati di Risolvibilità: Nel Teorema 2 viene provato che l'omogeneità stabilizzabile del sistema omogeneo senza disturbi è una condizione sufficiente per la risolvibilità del problema di allocazione dei guadagni ottimali inversi per sistemi omogenei, fornendo un metodo di progettazione esplicito del controllore.
Avanzamento Teorico: Vengono superate le limitazioni del metodo della letteratura 11 che non può essere direttamente applicato al caso di penalità sull'uscita, fornendo un framework teorico completo e una procedura di progettazione.

Dettagli del Metodo

Definizione del Compito

Si consideri il sistema nonlineare omogeneo rispetto all'operatore di dilatazione ∆rε: $\dot{x} = f(x) + G_1(x)u + G_2(x)w, \quad y = h(x) + du$

dove:

x ∈ ℝⁿ: stato
u ∈ ℝ: ingresso di controllo
w ∈ ℝξ: ingresso di disturbo
y ∈ ℝˡ: uscita
f(x) è un campo vettoriale omogeneo di grado k > -r₀
G₁(x), G₂(x) sono campi vettoriali omogenei di grado ς = -r₀
h(x) è una funzione omogenea di grado k + r₀

Ipotesi Chiave: hᵀd = 0, dᵀd = ϑ²I (condizioni di ortogonalità e peso di controllo)

Obiettivo: Trovare la legge di controllo u = α*(x) che minimizza il funzionale di costo: $J(u) = \sup_{w \in \Omega_w}\left\{\lim_{t\to\infty}\left[E(x(t)) + \int_0^t \left(l(x) + u^T R_1(x)u + y^T R_2(x)y - \gamma_0(|w|)\right)d\tau\right]\right\}$

Architettura del Modello

1. Costruzione del Sistema Ausiliario

Per determinare la penalità di disturbo γ₀(|w|), viene costruito il sistema ausiliario: $\dot{x} = \tilde{f}(x) + G_1(x)u$

dove: $\tilde{f}(x) = f(x) + G_2(x)\ell_\gamma(2|L_{G_2}V|)\frac{L_{G_2}V^T}{|L_{G_2}V|^2}$

qui ℓγ è la trasformata di Legendre-Fenchel di γ, dove γ è una funzione K∞.

Progettazione Chiave: Si sceglie γ(s) tale che ℓγ(2εs) = ε²ℓγ(2s), per garantire l'omogeneità del sistema ausiliario (Lemma 3).

2. Progettazione della Legge di Controllo

Legge di controllo di base (per stabilizzare il sistema ausiliario): $u = \alpha(x) = -\frac{\kappa}{2\vartheta^2}R(x)^{-1}(L_{G_1}V)^T$

dove R(x) è una funzione omogenea di grado 0, con |R(x)| limitato inferiormente da una costante positiva.

Legge di Controllo Ottimale Inversa: $u = \alpha^*(x) = -\frac{\beta\kappa}{2\vartheta^2}R(x)^{-1}(L_{G_1}V)^T, \quad \beta \geq 2$

3. Scelta delle Matrici di Peso

$R_1(x) = \frac{\vartheta^2}{\kappa}R(x), \quad R_2(x) = \frac{1}{\kappa}R(x)$

4. Costruzione della Penalità di Stato

$l(x) = \bar{l}(x) - \frac{h(x)^T R(x)h(x)}{\kappa}$

dove: $\bar{l}(x) = -2\beta(L_{\tilde{f}}V + L_{G_1}V\alpha(x)) + \beta(2-\lambda)\ell_\gamma(2|L_{G_2}V|) - \beta(\beta-2)L_{G_1}V\alpha(x)$

Punti di Innovazione Tecnica

1. Sistema Ausiliario che Preserva l'Omogeneità

Innovazione: Attraverso la scelta speciale di γ(s) = (1/μ)s², si garantisce che ℓγ(2εs) = ε²ℓγ(2s), preservando l'omogeneità del sistema ausiliario.

Significato: Questo è cruciale per provare la positività della penalità di stato l(x), poiché è necessario sfruttare l'omogeneità per estendere le proprietà locali a quelle globali.

2. Strategia di Scelta del Parametro κ (Lemma 4)

Sfida: Poiché l(x) = l̄(x) - h(x)ᵀR(x)h(x)/κ, e sia l̄(x) che h(x)ᵀR(x)h(x) sono funzioni nonlineari positive, è difficile garantire che l(x) > 0 per tutti gli x ∈ ℝⁿ{0}.

Soluzione:

Si definisce la funzione Hκ(x) = -κLf̃V(x) + LG₁V(x)α(x) - h(x)ᵀR(x)h(x)
Si sfrutta la sfera omogenea S = {x : Γ(x) = 1}
Si provano due casi (P+ e P-) su S per dimostrare che Hκ(x) > 0
Si estende il risultato a tutto ℝⁿ{0} attraverso l'omogeneità

Disuguaglianza Chiave: Si sceglie κ > κ₀ ≥ max{κc, κ₁}, dove:

κc = ρ₂/ρ₁ (gestisce la regione dove LG₁V = 0)
κ₁ è determinato da un'equazione quadratica (gestisce la regione dove LG₁V ≠ 0)

3. Continuità della Matrice di Peso R(x)

Problema: La costruzione di R(x) nella letteratura 11 garantisce solo la continuità di LG₁VR₁(x)⁻¹(LG₁V)ᵀ, non può garantire la continuità di h(x)ᵀR₂(x)h(x).

Soluzione: Si adotta il progettazione della matrice di peso del controllore di tipo Sontag (ispirato da 39):