2025-11-20T05:43:14.076539

Inverse optimal design of input-to-state stabilizing homogeneous controllers for nonlinear homogeneous systems

Lu, Lyu, Yu
This work studies the inverse optimality of input-to-state stabilizing controllers with input-output stability guarantees for nonlinear homogeneous systems. We formulate a new inverse optimal control problem, where the cost functional incorporates penalties on the output, in addition to the state, control and disturbance as in current related works. One benefit of penalizing the output is that the resulting inverse optimal controllers can ensure both input-to-state stability and input-output stability. We propose a technique for constructing the corresponding meaningful cost functional by using homogeneity properties, and provide sufficient conditions on solving the inverse optimal gain assignment problem. We show that homogeneous stabilizability of homogeneous systems in the case without disturbance is sufficient for the solvability of inverse optimal gain assignment problem for homogeneous systems.
academic

Diseño óptimo inverso de controladores homogéneos estabilizadores entrada-estado para sistemas no lineales homogéneos

Información Básica

  • ID del Artículo: 2511.15034
  • Título: Inverse optimal design of input-to-state stabilizing homogeneous controllers for nonlinear homogeneous systems
  • Autores: Kaixin Lu (National University of Singapore), Ziliang Lyu (Nanyang Technological University & Tongji University), Haoyong Yu (National University of Singapore)
  • Clasificación: eess.SY (Sistemas y Control), cs.SY
  • Fecha de Envío: 19 de noviembre de 2025
  • Enlace del Artículo: https://arxiv.org/abs/2511.15034

Resumen

Este artículo estudia el problema de optimalidad inversa de controladores entrada-estado estables (ISS) para sistemas no lineales homogéneos, proporcionando garantías de estabilidad entrada-salida (IOS). Se propone un nuevo problema de control óptimo inverso cuya función de costo incluye, además de las penalizaciones tradicionales de estado, control y perturbación, una penalización de la salida. El beneficio de este diseño es que el controlador óptimo inverso resultante garantiza simultáneamente ISS e IOS. Los autores utilizan propiedades de homogeneidad para proponer técnicas de construcción de funciones de costo significativas y proporcionan condiciones suficientes para resolver el problema de asignación de ganancia óptima inversa. Los resultados demuestran que la estabilizabilidad homogénea de sistemas homogéneos sin perturbación es una condición suficiente para la solubilidad del problema de asignación de ganancia óptima inversa homogénea.

Antecedentes de Investigación y Motivación

1. Problema Central a Resolver

El problema central que aborda este artículo es: ¿cómo diseñar un controlador óptimo inverso que garantice simultáneamente estabilidad entrada-estado (ISS) y estabilidad entrada-salida (IOS), y cómo construir una función de costo significativa para el mismo?

2. Importancia del Problema

  • Ventajas de la Optimalidad: Los controladores óptimos poseen muchas propiedades deseables, como margen de ganancia y robustez. El control óptimo inverso evita la dificultad de resolver la ecuación de Hamilton-Jacobi-Isaacs (HJI).
  • Limitaciones de ISS: ISS describe la relación entre estado y perturbación desde la perspectiva L∞, pero en ciertos sistemas de control (como control adaptativo modular basado en identificadores pasivos), es difícil garantizar que "la salida de interés" pertenezca al espacio L∞.
  • Necesidad de IOS: En problemas de control prácticos, después de garantizar ISS, es necesario entender cómo las perturbaciones de entrada afectan señales específicas de lazo cerrado para lograr atenuación de perturbaciones. Por ejemplo, en control H∞ no lineal, se requiere estabilidad de ganancia finita L2.

3. Limitaciones de Métodos Existentes

  • Trabajo Pionero de Krstic y Li 11: Propusieron un marco de control óptimo inverso ISS, pero su función de costo solo contiene penalizaciones de estado, control y perturbación, sin penalización de salida.
  • Falta de Garantía IOS: Como se muestra en el Ejemplo 1, los controladores óptimos inversos que no penalizan la salida pueden no garantizar IOS (como estabilidad L2).
  • Dificultad de Construcción: Cuando la salida es penalizada, es difícil encontrar una función de costo significativa, porque los términos de penalización deben ser no negativos en todo el espacio de estados.

4. Motivación de la Investigación

  • Ventajas de la Homogeneidad: La homogeneidad puede transformar propiedades locales del sistema en propiedades globales mediante escalamiento apropiado, proporcionando herramientas para resolver las dificultades anteriores.
  • Necesidad Teórica: Se requiere investigar bajo qué criterios de optimalidad los controladores ISS con garantía IOS son óptimos inversos.

Contribuciones Principales

  1. Nuevo Problema de Control Óptimo Inverso: Se propone por primera vez un problema de control óptimo inverso con penalización de salida en la función de costo (Definición 7), permitiendo que el controlador óptimo inverso garantice simultáneamente ISS e IOS.
  2. Técnicas de Construcción: Se proponen técnicas para construir funciones de costo significativas utilizando propiedades de homogeneidad (Lema 3 y Lema 4), resolviendo en particular el problema de cómo seleccionar parámetros κ y función γ(s) para garantizar que la penalización de estado l(x) sea definida positiva.
  3. Condiciones Suficientes: En el Teorema 1 se proporcionan condiciones suficientes para resolver el problema de asignación de ganancia óptima inversa, demostrando que el controlador diseñado garantiza simultáneamente ISS y estabilidad L2 de ganancia finita.
  4. Resultados de Solubilidad: En el Teorema 2 se demuestra que la estabilizabilidad homogénea de sistemas homogéneos sin perturbación es una condición suficiente para la solubilidad del problema de asignación de ganancia óptima inversa homogénea, proporcionando un método de diseño de controlador explícito.
  5. Avance Teórico: Se supera la limitación de que el método de la referencia 11 no puede aplicarse directamente al caso de penalización de salida, proporcionando un marco teórico completo y un procedimiento de diseño.

Explicación Detallada del Método

Definición de la Tarea

Considérese un sistema no lineal homogéneo respecto al operador de dilatación ∆ʳε: x˙=f(x)+G1(x)u+G2(x)w,y=h(x)+du\dot{x} = f(x) + G_1(x)u + G_2(x)w, \quad y = h(x) + du

donde:

  • x ∈ ℝⁿ: estado
  • u ∈ ℝ: entrada de control
  • w ∈ ℝξ: entrada de perturbación
  • y ∈ ℝˡ: salida
  • f(x) es un campo vectorial homogéneo de grado k > -r₀
  • G₁(x), G₂(x) son campos vectoriales homogéneos de grado ς = -r₀
  • h(x) es una función homogénea de grado k + r₀

Suposiciones Clave: hᵀd = 0, dᵀd = ϑ²I (condiciones de ortogonalidad y peso de control)

Objetivo: Encontrar la ley de control u = α*(x) que minimiza la función de costo: J(u)=supwΩw{limt[E(x(t))+0t(l(x)+uTR1(x)u+yTR2(x)yγ0(w))dτ]}J(u) = \sup_{w \in \Omega_w}\left\{\lim_{t\to\infty}\left[E(x(t)) + \int_0^t \left(l(x) + u^T R_1(x)u + y^T R_2(x)y - \gamma_0(|w|)\right)d\tau\right]\right\}

Arquitectura del Modelo

1. Construcción del Sistema Auxiliar

Para determinar la penalización de perturbación γ₀(|w|), se construye el sistema auxiliar: x˙=f~(x)+G1(x)u\dot{x} = \tilde{f}(x) + G_1(x)u

donde: f~(x)=f(x)+G2(x)γ(2LG2V)LG2VTLG2V2\tilde{f}(x) = f(x) + G_2(x)\ell_\gamma(2|L_{G_2}V|)\frac{L_{G_2}V^T}{|L_{G_2}V|^2}

Aquí ℓγ es la transformada de Legendre-Fenchel de γ, siendo γ una función K∞.

Diseño Clave: Se elige γ(s) tal que ℓγ(2εs) = ε²ℓγ(2s), para garantizar la homogeneidad del sistema auxiliar (Lema 3).

2. Diseño de la Ley de Control

Ley de control base (para estabilizar el sistema auxiliar): u=α(x)=κ2ϑ2R(x)1(LG1V)Tu = \alpha(x) = -\frac{\kappa}{2\vartheta^2}R(x)^{-1}(L_{G_1}V)^T

donde R(x) es una función homogénea de grado 0 que satisface que |R(x)| tiene una cota inferior positiva.

Ley de Control Óptima Inversa: u=α(x)=βκ2ϑ2R(x)1(LG1V)T,β2u = \alpha^*(x) = -\frac{\beta\kappa}{2\vartheta^2}R(x)^{-1}(L_{G_1}V)^T, \quad \beta \geq 2

3. Selección de Matrices de Peso

R1(x)=ϑ2κR(x),R2(x)=1κR(x)R_1(x) = \frac{\vartheta^2}{\kappa}R(x), \quad R_2(x) = \frac{1}{\kappa}R(x)

4. Construcción de la Penalización de Estado

l(x)=lˉ(x)h(x)TR(x)h(x)κl(x) = \bar{l}(x) - \frac{h(x)^T R(x)h(x)}{\kappa}

donde: lˉ(x)=2β(Lf~V+LG1Vα(x))+β(2λ)γ(2LG2V)β(β2)LG1Vα(x)\bar{l}(x) = -2\beta(L_{\tilde{f}}V + L_{G_1}V\alpha(x)) + \beta(2-\lambda)\ell_\gamma(2|L_{G_2}V|) - \beta(\beta-2)L_{G_1}V\alpha(x)

Puntos de Innovación Técnica

1. Sistema Auxiliar que Preserva Homogeneidad

Innovación: Mediante la selección especial de γ(s) = (1/μ)s², se garantiza que ℓγ(2εs) = ε²ℓγ(2s), preservando la homogeneidad del sistema auxiliar.

Significado: Esta es la clave para demostrar la positividad de la penalización de estado l(x), ya que se requiere utilizar homogeneidad para extender propiedades locales a globales.

2. Estrategia de Selección del Parámetro κ (Lema 4)

Desafío: Dado que l(x) = l̄(x) - h(x)ᵀR(x)h(x)/κ, y tanto l̄(x) como h(x)ᵀR(x)h(x) son funciones no lineales positivas, es difícil garantizar que l(x) > 0 para todo x ∈ ℝⁿ{0}.

Solución:

  • Se define la función Hκ(x) = -κLf̃V(x) + LG₁V(x)α(x) - h(x)ᵀR(x)h(x)
  • Se utiliza la esfera homogénea S = {x : Γ(x) = 1}
  • Se demuestran dos casos (P+ y P-) en S para probar que Hκ(x) > 0
  • Se extiende el resultado a todo ℝⁿ{0} mediante homogeneidad

Desigualdad Clave: Se toma κ > κ₀ ≥ max{κc, κ₁}, donde:

  • κc = ρ₂/ρ₁ (maneja la región donde LG₁V = 0)
  • κ₁ se determina por una ecuación cuadrática (maneja la región donde LG₁V ≠ 0)

3. Continuidad de la Matriz de Peso R(x)

Problema: La construcción de R(x) en la referencia 11 solo garantiza que LG₁VR₁(x)⁻¹(LG₁V)ᵀ sea continua, no puede garantizar que h(x)ᵀR₂(x)h(x) sea continua.

Solución: Se adopta el diseño de matriz de peso del controlador tipo Sontag (inspirado en 39):

undefined