Data-Driven Stabilization Using Prior Knowledge on Stabilizability and Controllability
Shakouri, van Waarde, Baltussen et al.
In this work, we study data-driven stabilization of linear time-invariant systems using prior knowledge of system-theoretic properties, specifically stabilizability and controllability. To formalize this, we extend the concept of data informativity by requiring the existence of a controller that stabilizes all systems consistent with the data and the prior knowledge. We show that if the system is controllable, then incorporating this as prior knowledge does not relax the conditions required for data-driven stabilization. Remarkably, however, we show that if the system is stabilizable, then using this as prior knowledge leads to necessary and sufficient conditions that are weaker than those for data-driven stabilization without prior knowledge. In other words, data-driven stabilization is easier if one knows that the underlying system is stabilizable. We also provide new data-driven control design methods in terms of linear matrix inequalities that complement the conditions for informativity.
academic
Estabilización Impulsada por Datos Utilizando Conocimiento Previo sobre Estabilizabilidad y Controlabilidad
Este artículo investiga el problema de estabilización impulsada por datos de sistemas lineales invariantes en el tiempo, utilizando propiedades de la teoría de sistemas (particularmente estabilizabilidad y controlabilidad) como conocimiento previo. Los autores extienden el concepto de informativididad de datos, requiriendo la existencia de un controlador que estabilice todos los sistemas consistentes con los datos y el conocimiento previo. Los resultados demuestran que: (1) si el sistema es controlable, utilizar esta propiedad como conocimiento previo no relaja las condiciones para estabilización impulsada por datos; (2) si el sistema es estabilizable, entonces usar este conocimiento previo produce condiciones necesarias y suficientes más débiles que sin conocimiento previo. En otras palabras, si se conoce que el sistema subyacente es estabilizable, la estabilización impulsada por datos se vuelve más factible. El artículo también proporciona nuevos métodos de diseño de control impulsado por datos basados en desigualdades matriciales lineales (LMI).
Este artículo aborda la siguiente cuestión: ¿Cómo diseñar un controlador estabilizador con datos limitados, integrando conocimiento previo sobre la estabilizabilidad o controlabilidad del sistema?
El control impulsado por datos tradicional asume que los parámetros del sistema son completamente desconocidos, pero esta suposición es excesivamente conservadora para la mayoría de sistemas físicos. En la práctica, frecuentemente disponemos de cierto conocimiento previo (como rangos de cantidades físicas tales como masa, constantes de resorte, o propiedades de controlabilidad/estabilizabilidad que pueden inferirse de la estructura del sistema).
Reducción de Requisitos de Datos: El diseño directo de controladores a partir de datos puede requerir una cantidad sustancial de datos para satisfacer condiciones de excitación persistente, pero la integración de conocimiento previo podría permitir estabilización con menos datos
Viabilidad Práctica: En algunos casos, el diseño de un controlador estabilizador es imposible usando únicamente datos (como cuando los datos de estado tienen rango deficiente), pero la incorporación de conocimiento previo podría hacer el diseño factible
Completitud Teórica: Las propiedades de la teoría de sistemas (controlabilidad, estabilizabilidad) son conceptos fundamentales en teoría de control, pero aún no han sido suficientemente estudiadas en el marco impulsado por datos
Control Impulsado por Datos: Los trabajos existentes (como De Persis & Tesi 2019, van Waarde et al. 2020) estudian principalmente el caso sin conocimiento previo, requiriendo condiciones de datos estrictas (como excitación persistente, datos de estado con rango completo)
Integración de Conocimiento Previo: La investigación existente se limita a restricciones de límites de parámetros 12-14 o parámetros parcialmente conocidos 15, sin abordar propiedades de la teoría de sistemas
Desafío de No-Convexidad: Los conjuntos de sistemas estabilizables y controlables son no-convexos, a diferencia de los conjuntos de sistemas convexos considerados en trabajos previos
En muchas aplicaciones prácticas, la controlabilidad o estabilizabilidad puede inferirse de la estructura del sistema (teoría de controlabilidad estructural), pero este tipo de conocimiento previo aún no ha sido utilizado en control impulsado por datos. Este artículo cierra esta brecha teórica.
Las principales contribuciones de este artículo incluyen:
Extensión del Marco Teórico: Se extiende el concepto de informativididad de datos (data informativity) para incluir conocimiento previo, proponiendo la definición de Σ_pk-informativididad (Definición 3)
Teorema de Equivalencia para Conocimiento Previo de Controlabilidad (Teorema 5): Se demuestra que utilizar controlabilidad como conocimiento previo es equivalente al caso sin conocimiento previo, es decir, el conocimiento previo de controlabilidad no puede relajar las condiciones de datos
Teoremas de Ventaja para Conocimiento Previo de Estabilizabilidad (Teoremas 14, 15):
Cuando los datos de estado tienen rango completo (rank X⁻ = n), el conocimiento previo de estabilizabilidad no proporciona ayuda adicional
Cuando los datos de estado tienen rango deficiente (rank X⁻ < n), el conocimiento previo de estabilizabilidad relaja significativamente las condiciones, proporcionando condiciones necesarias y suficientes
Método de Diseño Computable (Proposición 16): Se proporciona un método de cálculo de controlador estabilizador basado en LMI, que puede resolverse directamente a partir de datos Σ_stab-informativos
Perspectivas Teóricas: Se revela el fenómeno aparentemente paradójico de que una propiedad más fuerte (controlabilidad) no puede ayudar a relajar las condiciones, mientras que una propiedad más débil (estabilizabilidad) sí puede, debido a que en ciertos casos todos los sistemas consistentes con los datos son no-controlables
Modelo del Sistema: Se considera un sistema LTI en tiempo discreto
x(t+1) = A_true x(t) + B_true u(t)
donde x(t)∈ℝⁿ es el estado, u(t)∈ℝᵐ es la entrada, y las matrices del sistema (A_true, B_true) son desconocidas.
Datos: Datos entrada-estado recopilados desde el tiempo 0 hasta T
D := ([u(0),...,u(T-1)], [x(0),...,x(T)])
Se definen las matrices de datos:
U⁻ = u(0),...,u(T-1)
X⁻ = x(0),...,x(T-1)
X⁺ = x(1),...,x(T)
Conjunto de Sistemas Consistentes con Datos:
Σ_D := {(A,B) | X⁺ = AX⁻ + BU⁻}
Objetivo: Encontrar una ganancia de retroalimentación K tal que A+BK sea estable de Schur (todos los valores propios tienen módulo < 1) para todos los (A,B)∈Σ_D∩Σ_pk
Definición 3 (Σ_pk-informativididad para estabilización):
Los datos D se denominan Σ_pk-informativos para estabilización si existe K∈ℝᵐˣⁿ tal que A+BK es estable de Schur para todos los (A,B)∈Σ_D∩Σ_pk.
Conjuntos de Conocimiento Previo:
Σ_cont: Conjunto de todos los pares de sistemas controlables
Σ_stab: Conjunto de todos los pares de sistemas estabilizables
Teorema 5 (Resultado Central): Supóngase que (A_true, B_true)∈Σ_cont, entonces las siguientes afirmaciones son equivalentes:
(a) Los datos D son Σ_cont-informativos para estabilización
(b) Los datos D son informativos para estabilización (sin conocimiento previo)
Esquema de Prueba:
(b)⇒(a) es evidente
Para (a)⇒(b), la clave es:
Si Σ_D⊆Σ_cont, la conclusión es obvia
Si existe un (Ā,B̄)∈Σ_D no-controlable, se utiliza el Lema 7 (parametrización de familias de sistemas que son controlables en casi todos los puntos) y el Lema 9 (estabilidad de haces de matrices) para demostrar que la ganancia de estabilización K también estabiliza (Ā,B̄)
Lemas Clave:
Lema 7: Si (M,N) es controlable, entonces (M+αM₀, N+αN₀) es controlable para todos excepto a lo sumo n² valores de α
Lema 9: Si M+δN es estable de Schur para todos los δ∈[ε,∞)\F (donde F es finito), entonces N es nilpotente y M+δN es estable de Schur para todos los δ∈ℝ
Si los datos son Σ_stab-informativos y K es una ganancia de estabilización, entonces:
(a) (A₀+B₀K)R(A,B) = {0} para todos los (A,B)∈Σ_D∩Σ_stab y (A₀,B₀)∈Σ⁰_D
(b) Si rank X⁻ < n, entonces imX⁻;U⁻ = im X⁻ × ℝᵐ
(c) im X⁺ ⊆ im X⁻
(d) im X⁻ es A-invariante y contiene im B
Observación 11: La condición (a) es una relajación de A₀+B₀K=0 del caso sin conocimiento previo; las condiciones (b)-(d) se satisfacen automáticamente cuando rank X⁻ = n, pero son no-triviales en el caso de rango deficiente.
Si el sistema verdadero es controlable, el Teorema 5 proporciona la conclusión
Si el sistema verdadero es no-controlable, se construye K̂ tal que para todos los (A,B)∈Σ_D se tiene A+BK̂ = A_true+B_true K̂, y luego se demuestra que este último es estable de Schur
De Persis & Tesi (2019): Primer método LMI para diseñar retroalimentación estabilizadora directamente desde datos, requiere condición de excitación persistente
van Waarde et al. (2020): Propone marco de informativididad de datos, proporciona condiciones necesarias y suficientes, no requiere identificación única
Caso con Ruido: van Waarde et al. (2020), Li et al. (2026) estudian síntesis de controladores con datos ruidosos
Jia et al. (2020) y otros estudian la inferencia de controlabilidad desde la estructura del sistema; este artículo puede verse como un puente para utilizar esta información estructural en control impulsado por datos.
Inefectividad del Conocimiento Previo de Controlabilidad: Si se conoce que el sistema es controlable, este conocimiento previo no puede relajar las condiciones para estabilización impulsada por datos (Teorema 5)
Efectividad del Conocimiento Previo de Estabilizabilidad:
Sin efecto cuando los datos de estado tienen rango completo (Teorema 14)
Relaja significativamente las condiciones cuando los datos de estado tienen rango deficiente (Teorema 15)
Fenómeno Contraintuitivo: Una propiedad más fuerte (controlabilidad) no es beneficiosa, mientras que una propiedad más débil (estabilizabilidad) sí lo es—la razón es que es posible que todos los sistemas consistentes con los datos sean no-controlables
Método de Diseño Práctico: Se proporciona un método de diseño de controlador basado en LMI computable (Proposición 16)
Suposición sin Ruido: La teoría actual solo se aplica a datos sin ruido; la extensión a casos con ruido es un problema abierto
Datos Fuera de Línea: Requiere recopilar un conjunto de datos completo previamente, no es adecuado para escenarios de aprendizaje en línea
Sistemas Lineales: Solo considera sistemas LTI; la extensión a sistemas no-lineales presenta desafíos
Conocimiento Previo Binario: Solo considera "estabilizable" o "no-estabilizable", sin considerar conocimiento previo más granular como límites en la dimensión del subespacio alcanzable
Estabilidad de Schur: Solo considera estabilidad, sin abordar indicadores de desempeño (como norma H∞)
Manejo de Conocimiento Previo No-Convexo: Primer estudio de conocimiento previo no-convexo en control impulsado por datos (los conjuntos de sistemas estabilizables/controlables son no-convexos), con alta dificultad técnica
Condiciones Necesarias y Suficientes: El Teorema 15 proporciona condiciones necesarias y suficientes para el caso de rango deficiente, con completitud teórica
Resultados Contraintuitivos: Revela el fenómeno de que la controlabilidad (propiedad más fuerte) no es beneficiosa pero la estabilizabilidad (propiedad más débil) sí lo es, proporcionando perspectivas profundas
Lema 7 (Controlabilidad Parametrizada): Utiliza propiedades polinomiales de la matriz de Kalman, demostrando que la controlabilidad se mantiene en "casi todos los puntos"
Lema 9 (Análisis de Haces de Matrices): Deduce nilpotencia a través de propiedades de la traza polinomial, técnica ingeniosa
Lema 17 (Descomposición Impulsada por Datos): Logra descomposición sin conocer las matrices del sistema, con fuerte innovación
Problema de la Observación 19: La informativididad Σ_stab no garantiza estabilización cuadrática (quadratic stabilization), lo que podría limitar aplicaciones prácticas
Falta de Análisis de Conservadurismo: No cuantifica cuántos datos se pueden ahorrar con conocimiento previo de estabilizabilidad en comparación con sin conocimiento previo
Prueba de Necesidad Incompleta: La prueba de necesidad de las condiciones (b)-(d) en el Teorema 10 depende de (a), pero la necesidad de (a) misma tiene una prueba compleja
Fundamento Teórico: Sienta las bases para integrar propiedades de la teoría de sistemas en control impulsado por datos, abriendo nuevas direcciones de investigación
Metodología: Las técnicas para manejar conocimiento previo no-convexo pueden generalizarse a otras propiedades de sistemas (como pasividad, positividad)
Papel de Puente: Conecta la teoría de controlabilidad estructural con control impulsado por datos
Este es un artículo teórico de alta calidad en teoría de control, que hace contribuciones importantes al campo del control impulsado por datos. Los puntos destacados principales son:
Primer estudio sistemático de propiedades de la teoría de sistemas como conocimiento previo
Revela la distinción esencial entre controlabilidad y estabilizabilidad
Proporciona condiciones necesarias y suficientes completas y método computable
Las principales deficiencias son validación experimental insuficiente y falta de consideración de robustez ante ruido.
Índice de Recomendación: ⭐⭐⭐⭐☆ (4/5)
Profundidad Teórica: ⭐⭐⭐⭐⭐
Valor Práctico: ⭐⭐⭐⭐
Suficiencia Experimental: ⭐⭐⭐
Calidad de Escritura: ⭐⭐⭐⭐⭐
Innovación: ⭐⭐⭐⭐⭐
Apropiado para publicación en revistas de primer nivel en teoría de control (como IEEE TAC, Automatica), con valor de referencia importante para investigadores en control impulsado por datos y teoría de sistemas.
3 H. J. van Waarde et al., "Data informativity: A new perspective on data-driven analysis and control," IEEE TAC, 2020. (Trabajo fundamental del marco de informativididad de datos)
4 C. De Persis & P. Tesi, "Formulas for data-driven control: Stabilization, optimality, and robustness," IEEE TAC, 2019. (Primer método LMI para estabilización impulsada por datos)
12 J. Berberich et al., "Combining prior knowledge and data for robust controller design," IEEE TAC, 2022. (Conocimiento previo de límites de parámetros)
25 J. Jia et al., "A unifying framework for strong structural controllability," IEEE TAC, 2020. (Teoría de controlabilidad estructural)
27 H. J. van Waarde & M. K. Camlibel, "A matrix Finsler's lemma with applications to data-driven control," CDC, 2021. (Teoría de estabilización cuadrática)