2025-11-20T05:43:14.076539

Inverse optimal design of input-to-state stabilizing homogeneous controllers for nonlinear homogeneous systems

Lu, Lyu, Yu
This work studies the inverse optimality of input-to-state stabilizing controllers with input-output stability guarantees for nonlinear homogeneous systems. We formulate a new inverse optimal control problem, where the cost functional incorporates penalties on the output, in addition to the state, control and disturbance as in current related works. One benefit of penalizing the output is that the resulting inverse optimal controllers can ensure both input-to-state stability and input-output stability. We propose a technique for constructing the corresponding meaningful cost functional by using homogeneity properties, and provide sufficient conditions on solving the inverse optimal gain assignment problem. We show that homogeneous stabilizability of homogeneous systems in the case without disturbance is sufficient for the solvability of inverse optimal gain assignment problem for homogeneous systems.
academic

Conception inverse optimale de contrôleurs homogènes stabilisants entrée-état pour systèmes non linéaires homogènes

Informations de base

  • ID de l'article: 2511.15034
  • Titre: Inverse optimal design of input-to-state stabilizing homogeneous controllers for nonlinear homogeneous systems
  • Auteurs: Kaixin Lu (National University of Singapore), Ziliang Lyu (Nanyang Technological University & Tongji University), Haoyong Yu (National University of Singapore)
  • Classification: eess.SY (Systèmes et Contrôle), cs.SY
  • Date de soumission: 19 novembre 2025
  • Lien de l'article: https://arxiv.org/abs/2511.15034

Résumé

Cet article étudie le problème d'optimalité inverse des contrôleurs stabilisant entrée-état (ISS) pour les systèmes non linéaires homogènes, en fournissant des garanties de stabilité entrée-sortie (IOS). L'article propose un nouveau problème de contrôle optimal inverse dont la fonctionnelle de coût ajoute une pénalité sur la sortie aux pénalités traditionnelles sur l'état, la commande et la perturbation. L'avantage de cette conception est que le contrôleur optimal inverse résultant garantit simultanément l'ISS et l'IOS. Les auteurs proposent des techniques de construction de fonctionnelles de coût significatives en exploitant la propriété d'homogénéité, et fournissent des conditions suffisantes pour résoudre le problème d'allocation de gain optimal inverse. Les résultats montrent que la stabilisabilité homogène du système homogène sans perturbation est une condition suffisante pour la résolubilité du problème d'allocation de gain optimal inverse pour les systèmes homogènes.

Contexte de recherche et motivation

1. Problème fondamental à résoudre

Le problème fondamental abordé dans cet article est: comment concevoir un contrôleur optimal inverse qui garantisse simultanément la stabilité entrée-état (ISS) et la stabilité entrée-sortie (IOS), et comment construire une fonctionnelle de coût significative pour celui-ci.

2. Importance du problème

  • Avantages de l'optimalité: Les contrôleurs optimaux possèdent de nombreuses propriétés souhaitables, telles que les marges de gain et la robustesse. Le contrôle optimal inverse évite la difficulté de résoudre l'équation de Hamilton-Jacobi-Isaacs (HJI).
  • Limitations de l'ISS: L'ISS décrit la relation entre l'état et la perturbation du point de vue L∞, mais dans certains systèmes de contrôle (comme le contrôle adaptatif modulaire basé sur l'identification passive), il est difficile de garantir que la "sortie d'intérêt" appartient à l'espace L∞.
  • Nécessité de l'IOS: Dans les problèmes de contrôle pratiques, après avoir garanti l'ISS, il est nécessaire de comprendre comment l'entrée de perturbation affecte les signaux de boucle fermée spécifiques pour réaliser l'atténuation des perturbations. Par exemple, dans le contrôle H∞ non linéaire, une stabilité L2 à gain fini est requise.

3. Limitations des méthodes existantes

  • Travail fondateur de Krstic et Li 11: Propose un cadre de contrôle optimal inverse ISS, mais sa fonctionnelle de coût ne contient que des pénalités sur l'état, la commande et la perturbation, sans pénalité sur la sortie.
  • Absence de garantie IOS: Comme le montre l'Exemple 1, un contrôleur optimal inverse sans pénalité de sortie peut ne pas garantir l'IOS (comme la stabilité L2).
  • Difficulté de construction: Lorsque la sortie est pénalisée, il est difficile de trouver une fonctionnelle de coût significative, car le terme de pénalité doit être non-négatif sur tout l'espace d'état.

4. Motivation de la recherche

  • Avantages de l'homogénéité: L'homogénéité peut transformer les propriétés locales du système en propriétés globales par un changement d'échelle approprié, ce qui fournit un outil pour surmonter les difficultés ci-dessus.
  • Besoin théorique: Il est nécessaire d'étudier selon quel critère d'optimalité un contrôleur ISS avec garantie IOS est optimal inverse.

Contributions principales

  1. Nouveau problème de contrôle optimal inverse: Propose pour la première fois un problème de contrôle optimal inverse avec pénalité de sortie dans la fonctionnelle de coût (Définition 7), permettant au contrôleur optimal inverse de garantir simultanément l'ISS et l'IOS.
  2. Techniques de construction: Propose des techniques de construction de fonctionnelles de coût significatives en exploitant la propriété d'homogénéité (Lemmes 3 et 4), résolvant en particulier le problème difficile de la sélection des paramètres κ et de la fonction γ(s) pour garantir la positivité de la pénalité d'état l(x).
  3. Conditions suffisantes: Fournit dans le Théorème 1 des conditions suffisantes pour résoudre le problème d'allocation de gain optimal inverse, prouvant que le contrôleur conçu garantit simultanément l'ISS et la stabilité L2 à gain fini.
  4. Résultats de résolubilité: Prouve dans le Théorème 2 que la stabilisabilité homogène du système homogène sans perturbation est une condition suffisante pour la résolubilité du problème d'allocation de gain optimal inverse pour les systèmes homogènes, et fournit une méthode de conception de contrôleur explicite.
  5. Percée théorique: Surmonte la limitation que la méthode de la référence 11 ne peut pas être directement appliquée au cas avec pénalité de sortie, fournissant un cadre théorique complet et un processus de conception.

Explication détaillée de la méthode

Définition de la tâche

Considérez un système non linéaire homogène par rapport à l'opérateur de dilatation ∆ʳε: x˙=f(x)+G1(x)u+G2(x)w,y=h(x)+du\dot{x} = f(x) + G_1(x)u + G_2(x)w, \quad y = h(x) + du

où:

  • x ∈ ℝⁿ: l'état
  • u ∈ ℝ: l'entrée de commande
  • w ∈ ℝξ: l'entrée de perturbation
  • y ∈ ℝˡ: la sortie
  • f(x) est un champ de vecteurs homogène de degré k > -r₀
  • G₁(x), G₂(x) sont des champs de vecteurs homogènes de degré ς = -r₀
  • h(x) est une fonction homogène de degré k + r₀

Hypothèses clés: hᵀd = 0, dᵀd = ϑ²I (conditions d'orthogonalité et de pondération de commande)

Objectif: Trouver la loi de commande u = α*(x) minimisant la fonctionnelle de coût: J(u)=supwΩw{limt[E(x(t))+0t(l(x)+uTR1(x)u+yTR2(x)yγ0(w))dτ]}J(u) = \sup_{w \in \Omega_w}\left\{\lim_{t\to\infty}\left[E(x(t)) + \int_0^t \left(l(x) + u^T R_1(x)u + y^T R_2(x)y - \gamma_0(|w|)\right)d\tau\right]\right\}

Architecture du modèle

1. Construction du système auxiliaire

Pour déterminer la pénalité de perturbation γ₀(|w|), on construit le système auxiliaire: x˙=f~(x)+G1(x)u\dot{x} = \tilde{f}(x) + G_1(x)u

où: f~(x)=f(x)+G2(x)γ(2LG2V)LG2VTLG2V2\tilde{f}(x) = f(x) + G_2(x)\ell_\gamma(2|L_{G_2}V|)\frac{L_{G_2}V^T}{|L_{G_2}V|^2}

Ici, ℓγ est la transformée de Legendre-Fenchel de γ, où γ est une fonction K∞.

Conception clé: Choisir γ(s) tel que ℓγ(2εs) = ε²ℓγ(2s) pour garantir l'homogénéité du système auxiliaire (Lemme 3).

2. Conception de la loi de commande

Loi de commande de base (pour stabiliser le système auxiliaire): u=α(x)=κ2ϑ2R(x)1(LG1V)Tu = \alpha(x) = -\frac{\kappa}{2\vartheta^2}R(x)^{-1}(L_{G_1}V)^T

où R(x) est une fonction homogène de degré 0 satisfaisant une borne inférieure positive pour |R(x)|.

Loi de commande optimale inverse: u=α(x)=βκ2ϑ2R(x)1(LG1V)T,β2u = \alpha^*(x) = -\frac{\beta\kappa}{2\vartheta^2}R(x)^{-1}(L_{G_1}V)^T, \quad \beta \geq 2

3. Sélection des matrices de pondération

R1(x)=ϑ2κR(x),R2(x)=1κR(x)R_1(x) = \frac{\vartheta^2}{\kappa}R(x), \quad R_2(x) = \frac{1}{\kappa}R(x)

4. Construction de la pénalité d'état

l(x)=lˉ(x)h(x)TR(x)h(x)κl(x) = \bar{l}(x) - \frac{h(x)^T R(x)h(x)}{\kappa}

où: lˉ(x)=2β(Lf~V+LG1Vα(x))+β(2λ)γ(2LG2V)β(β2)LG1Vα(x)\bar{l}(x) = -2\beta(L_{\tilde{f}}V + L_{G_1}V\alpha(x)) + \beta(2-\lambda)\ell_\gamma(2|L_{G_2}V|) - \beta(\beta-2)L_{G_1}V\alpha(x)

Points d'innovation technique

1. Système auxiliaire préservant l'homogénéité

Innovation: En choisissant spécialement γ(s) = (1/μ)s², on garantit que ℓγ(2εs) = ε²ℓγ(2s), préservant l'homogénéité du système auxiliaire.

Signification: C'est la clé pour prouver la positivité de la pénalité d'état l(x), car il faut exploiter l'homogénéité pour étendre les propriétés locales au global.

2. Stratégie de sélection du paramètre κ (Lemme 4)

Défi: Puisque l(x) = l̄(x) - h(x)ᵀR(x)h(x)/κ, où l̄(x) et h(x)ᵀR(x)h(x) sont tous deux des fonctions non linéaires positives, il est difficile de garantir que l(x) > 0 pour tout x ∈ ℝⁿ{0}.

Solution:

  • Définir la fonction Hκ(x) = -κLf̃V(x) + LG₁V(x)α(x) - h(x)ᵀR(x)h(x)
  • Utiliser la sphère homogène S = {x : Γ(x) = 1}
  • Prouver Hκ(x) > 0 sur S dans deux cas (P+ et P-)
  • Étendre le résultat à tout ℝⁿ{0} par homogénéité

Inégalité clé: Prendre κ > κ₀ ≥ max{κc, κ₁}, où:

  • κc = ρ₂/ρ₁ (traiter la région où LG₁V = 0)
  • κ₁ est déterminé par une équation quadratique (traiter la région où LG₁V ≠ 0)

3. Continuité de la matrice de pondération R(x)

Problème: La construction de R(x) dans la référence 11 garantit seulement la continuité de LG₁VR₁(x)⁻¹(LG₁V)ᵀ, mais ne peut pas garantir la continuité de h(x)ᵀR₂(x)h(x).

Solution: Adopter la conception de matrice de pondération du type contrôleur de Sontag (inspirée par 39):

undefined