Data-Driven Stabilization Using Prior Knowledge on Stabilizability and Controllability
Shakouri, van Waarde, Baltussen et al.
In this work, we study data-driven stabilization of linear time-invariant systems using prior knowledge of system-theoretic properties, specifically stabilizability and controllability. To formalize this, we extend the concept of data informativity by requiring the existence of a controller that stabilizes all systems consistent with the data and the prior knowledge. We show that if the system is controllable, then incorporating this as prior knowledge does not relax the conditions required for data-driven stabilization. Remarkably, however, we show that if the system is stabilizable, then using this as prior knowledge leads to necessary and sufficient conditions that are weaker than those for data-driven stabilization without prior knowledge. In other words, data-driven stabilization is easier if one knows that the underlying system is stabilizable. We also provide new data-driven control design methods in terms of linear matrix inequalities that complement the conditions for informativity.
academic
Stabilizzazione Guidata dai Dati Utilizzando Conoscenze Preliminari sulla Stabilizzabilità e Controllabilità
Questo articolo affronta il problema della stabilizzazione guidata dai dati di sistemi lineari tempo-invarianti utilizzando proprietà della teoria dei sistemi (in particolare stabilizzabilità e controllabilità) come conoscenze preliminari. Gli autori estendono il concetto di informatività dei dati, richiedendo l'esistenza di un controllore che stabilizzi tutti i sistemi coerenti con i dati e le conoscenze preliminari. I risultati principali mostrano che: (1) se il sistema è controllabile, l'utilizzo di questa conoscenza preliminare non rilassa le condizioni per la stabilizzazione guidata dai dati; (2) se il sistema è stabilizzabile, l'utilizzo di questa conoscenza preliminare fornisce condizioni sufficienti e necessarie più deboli rispetto al caso senza conoscenze preliminari. In altre parole, se si conosce che il sistema sottostante è stabilizzabile, la stabilizzazione guidata dai dati diventa più facile da realizzare. L'articolo fornisce inoltre un nuovo metodo di progettazione del controllo guidato dai dati basato su disuguaglianze matriciali lineari (LMI).
L'articolo affronta la seguente questione: Come progettare un controllore stabilizzante con dati limitati, integrando conoscenze preliminari sulla stabilizzabilità o controllabilità del sistema?
Il controllo guidato dai dati tradizionale assume che i parametri del sistema siano completamente sconosciuti, ma per la maggior parte dei sistemi fisici, questa ipotesi è eccessivamente conservativa. In pratica, spesso possediamo conoscenze preliminari (come intervalli di quantità fisiche quali massa e costanti elastiche, o proprietà di controllabilità/stabilizzabilità deducibili dalla struttura del sistema).
Riduzione dei Requisiti di Dati: La progettazione diretta del controllore dai dati potrebbe richiedere una grande quantità di dati per soddisfare le condizioni di eccitazione persistente, ma l'integrazione di conoscenze preliminari potrebbe consentire la stabilizzazione con meno dati
Fattibilità Pratica: In alcuni casi, la progettazione di un controllore stabilizzante è impossibile utilizzando solo i dati (ad esempio, quando i dati di stato hanno rango deficiente), ma l'aggiunta di conoscenze preliminari potrebbe rendere il progetto fattibile
Completezza Teorica: Le proprietà della teoria dei sistemi (controllabilità, stabilizzabilità) sono concetti fondamentali della teoria del controllo, ma non sono stati sufficientemente studiati nel contesto del controllo guidato dai dati
Controllo Guidato dai Dati: I lavori esistenti (come De Persis & Tesi 2019, van Waarde et al. 2020) affrontano principalmente il caso senza conoscenze preliminari, richiedendo condizioni rigorose sui dati (come eccitazione persistente e rango pieno dei dati di stato)
Integrazione di Conoscenze Preliminari: La ricerca esistente si limita a vincoli su intervalli di parametri 12-14 o parametri parzialmente noti 15, senza affrontare proprietà della teoria dei sistemi
Sfida della Non-Convessità: Gli insiemi di sistemi stabilizzabili e controllabili sono non-convessi, a differenza degli insiemi di sistemi convessi considerati nei lavori precedenti
In molte applicazioni pratiche, la controllabilità o la stabilizzabilità possono essere dedotte dalla struttura del sistema (teoria della controllabilità strutturale), ma queste conoscenze preliminari non sono state ancora utilizzate nel controllo guidato dai dati. Questo articolo colma questo vuoto teorico.
Estensione del Quadro Teorico: Estensione del concetto di informatività dei dati per includere conoscenze preliminari, introducendo la definizione di Σ_pk-informatività (Definizione 3)
Teorema di Equivalenza per Controllabilità (Teorema 5): Dimostra che l'utilizzo della controllabilità come conoscenza preliminare è equivalente al caso senza conoscenze preliminari, cioè la conoscenza preliminare di controllabilità non rilassa le condizioni sui dati
Teoremi di Vantaggio per Stabilizzabilità (Teoremi 14, 15):
Quando i dati di stato hanno rango pieno (rank X⁻ = n), la conoscenza preliminare di stabilizzabilità non fornisce aiuto aggiuntivo
Quando i dati di stato hanno rango deficiente (rank X⁻ < n), la conoscenza preliminare di stabilizzabilità rilassa significativamente le condizioni, fornendo condizioni sufficienti e necessarie
Metodo di Progettazione Calcolabile (Proposizione 16): Fornisce un metodo di calcolo del controllore stabilizzante basato su LMI, risolvibile direttamente dai dati Σ_stab-informativi
Intuizioni Teoriche: Rivela il fenomeno apparentemente contraddittorio secondo cui una proprietà più forte (controllabilità) non aiuta a rilassare le condizioni, mentre una proprietà più debole (stabilizzabilità) lo fa, perché in alcuni casi tutti i sistemi coerenti con i dati non sono controllabili
Modello del Sistema: Consideriamo un sistema LTI a tempo discreto
x(t+1) = A_true x(t) + B_true u(t)
dove x(t)∈ℝⁿ è lo stato, u(t)∈ℝᵐ è l'ingresso, e le matrici di sistema (A_true, B_true) sono sconosciute.
Dati: Dati ingresso-stato raccolti dal tempo 0 al tempo T
D := ([u(0),...,u(T-1)], [x(0),...,x(T)])
Definiamo le matrici di dati:
U⁻ = u(0),...,u(T-1)
X⁻ = x(0),...,x(T-1)
X⁺ = x(1),...,x(T)
Insieme di Sistemi Coerenti con i Dati:
Σ_D := {(A,B) | X⁺ = AX⁻ + BU⁻}
Obiettivo: Trovare il guadagno di retroazione K tale che A+BK sia stabile secondo Schur (tutti gli autovalori hanno modulo < 1) per tutti i (A,B)∈Σ_D∩Σ_pk
Definizione 3 (Σ_pk-informatività per la Stabilizzazione):
I dati D sono detti Σ_pk-informativi per la stabilizzazione se esiste K∈ℝᵐˣⁿ tale che A+BK sia stabile secondo Schur per tutti i (A,B)∈Σ_D∩Σ_pk.
Insiemi di Conoscenze Preliminari:
Σ_cont: insieme di tutte le coppie di sistemi controllabili
Σ_stab: insieme di tutte le coppie di sistemi stabilizzabili
Teorema 5 (Risultato Principale): Assumendo (A_true, B_true)∈Σ_cont, le seguenti affermazioni sono equivalenti:
(a) I dati D sono Σ_cont-informativi per la stabilizzazione
(b) I dati D sono informativi per la stabilizzazione (senza conoscenze preliminari)
Idea della Dimostrazione:
(b)⇒(a) è ovvio
(a)⇒(b) è la parte cruciale:
Se Σ_D⊆Σ_cont, la conclusione è ovvia
Se esiste un sistema non controllabile (Ā,B̄)∈Σ_D, si utilizza il Lemma 7 (parametrizzazione di famiglie di sistemi controllabili quasi ovunque) e il Lemma 9 (stabilità di fasci matriciali) per dimostrare che il controllore stabilizzante K stabilizza anche (Ā,B̄)
Lemmi Chiave:
Lemma 7: Se (M,N) è controllabile, allora (M+αM₀, N+αN₀) è controllabile per tutti gli α eccetto al più n² valori
Lemma 9: Se M+δN è stabile secondo Schur per tutti i δ∈[ε,∞)\F (F finito), allora N è nilpotente e M+δN è stabile secondo Schur per tutti i δ∈ℝ
Se i dati sono Σ_stab-informativi e K è il guadagno stabilizzante, allora:
(a) (A₀+B₀K)R(A,B) = {0} per tutti i (A,B)∈Σ_D∩Σ_stab e (A₀,B₀)∈Σ⁰_D
(b) Se rank X⁻ < n, allora imX⁻;U⁻ = im X⁻ × ℝᵐ
(c) im X⁺ ⊆ im X⁻
(d) im X⁻ è A-invariante e contiene im B
Osservazione 11: La condizione (a) è una versione rilassata di A₀+B₀K=0 nel caso senza conoscenze preliminari; le condizioni (b)-(d) sono automaticamente soddisfatte quando rank X⁻ = n, ma sono non-banali nel caso di rango deficiente.
Se il sistema vero è controllabile, dal Teorema 5 segue la conclusione
Se il sistema vero non è controllabile, si costruisce K̂ tale che per tutti i (A,B)∈Σ_D si ha A+BK̂ = A_true+B_true K̂, quindi si dimostra che quest'ultimo è stabile secondo Schur
De Persis & Tesi (2019): Primo lavoro che propone il metodo LMI per la progettazione diretta del feedback stabilizzante dai dati, richiedendo condizioni di eccitazione persistente
van Waarde et al. (2020): Propone il quadro di informatività dei dati, fornisce condizioni sufficienti e necessarie, non richiede identificazione unica
Caso con Rumore: van Waarde et al. (2020), Li et al. (2026) studiano la sintesi del controllore con dati rumorosi
Vincoli su Intervalli di Parametri: Berberich et al. (2022) studiano conoscenze preliminari rappresentate come frazioni lineari
Parametri Parzialmente Noti: Huang et al. (2025) studiano il metodo della funzione di densità per sistemi polinomiali
Innovazione di Questo Articolo: Primo studio sistematico di proprietà della teoria dei sistemi (controllabilità/stabilizzabilità) come conoscenze preliminari
Vincoli di Stabilità: van Gestel et al. (2002), Lacy & Bernstein (2003)
Vincoli su Autovalori: Miller & De Callafon (2013)
Positività/Passività: De Santis & Farina (2002), Goethals et al. (2003)
Differenza di Questo Articolo: Focalizzato sulla progettazione del controllore piuttosto che sull'identificazione, e affronta insiemi di conoscenze preliminari non-convessi
Jia et al. (2020) e altri studiano l'inferenza della controllabilità dalla struttura del sistema; questo articolo può essere visto come un ponte tra queste informazioni strutturali e il controllo guidato dai dati.
Inefficacia della Conoscenza Preliminare di Controllabilità: Se si conosce che il sistema è controllabile, questa conoscenza preliminare non rilassa le condizioni per la stabilizzazione guidata dai dati (Teorema 5)
Efficacia della Conoscenza Preliminare di Stabilizzabilità:
Quando i dati di stato hanno rango pieno, non fornisce aiuto (Teorema 14)
Quando i dati di stato hanno rango deficiente, rilassa significativamente le condizioni (Teorema 15)
Fenomeno Controintuitivo: Una proprietà più forte (controllabilità) non è utile, mentre una proprietà più debole (stabilizzabilità) lo è — la ragione è che potrebbe accadere che tutti i sistemi coerenti con i dati non siano controllabili
Metodo di Progettazione Pratico: Fornisce un metodo di progettazione del controllore calcolabile basato su LMI (Proposizione 16)
Ipotesi di Assenza di Rumore: La teoria attuale si applica solo ai dati senza rumore; l'estensione al caso con rumore è un problema aperto
Dati Offline: Richiede la raccolta preliminare di un insieme di dati completo, non adatto a scenari di apprendimento online
Sistemi Lineari: Considera solo sistemi LTI; l'estensione a sistemi non lineari presenta sfide significative
Conoscenze Preliminari Binarie: Considera solo "stabilizzabile" o "non stabilizzabile", non considera conoscenze preliminari più granulari come limiti superiori sulla dimensione del sottospazio raggiungibile
Stabilità secondo Schur: Considera solo la stabilità, non affronta indicatori di prestazione (come la norma H∞)
Gestione di Conoscenze Preliminari Non-Convesse: Primo lavoro nel controllo guidato dai dati ad affrontare insiemi di conoscenze preliminari non-convessi (gli insiemi di sistemi stabilizzabili/controllabili sono non-convessi), con elevata difficoltà tecnica
Condizioni Sufficienti e Necessarie: Il Teorema 15 fornisce condizioni sufficienti e necessarie per il caso di rango deficiente, con completezza teorica
Risultati Controintuitivi: Rivela il fenomeno secondo cui la controllabilità non è utile ma la stabilizzabilità lo è, fornendo intuizioni profonde
Lemma 7 (Controllabilità Parametrizzata): Utilizza la proprietà polinomiale della matrice di Kalman, dimostrando che la controllabilità vale "quasi ovunque"
Lemma 9 (Analisi di Fasci Matriciali): Attraverso la proprietà polinomiale della traccia deduce la nilpotenza, tecnica ingegnosa
Lemma 17 (Decomposizione Guidata dai Dati): Realizza la decomposizione senza conoscere le matrici del sistema, con forte innovatività
Problema dell'Osservazione 19: L'informatività Σ_stab non garantisce la stabilizzazione quadratica, che potrebbe limitare le applicazioni pratiche
Mancanza di Analisi di Conservatività: Non quantifica quanto la conoscenza preliminare di stabilizzabilità possa risparmiare dati rispetto al caso senza conoscenze preliminari
Dimostrazione di Necessità Incompleta: La dimostrazione della necessità nel Teorema 10(b)-(d) dipende da (a), ma la necessità di (a) stessa è complessa
Acquisizione di Conoscenze Preliminari: Non discute come verificare in pratica che il sistema è stabilizzabile (potrebbe richiedere identificazione parziale)
Gestione dei Fallimenti: Cosa fare se l'LMI (11) non è fattibile?
Dati in Anello Chiuso: Considera solo dati in anello aperto, il caso di dati in anello chiuso non è affrontato
Fondamenti Teorici: Pone le basi per l'integrazione di proprietà della teoria dei sistemi nel controllo guidato dai dati, aprendo nuove direzioni di ricerca
Metodologia: Le tecniche per gestire conoscenze preliminari non-convesse possono essere generalizzate ad altre proprietà di sistema (come passività, positività)
Ruolo di Ponte: Collega la teoria della controllabilità strutturale con il controllo guidato dai dati
Questo è un articolo teorico di alta qualità nel controllo, che fornisce importanti contributi al settore del controllo guidato dai dati. I principali punti di forza sono:
Primo studio sistematico di proprietà della teoria dei sistemi come conoscenze preliminari
Rivela la distinzione essenziale tra controllabilità e stabilizzabilità
Fornisce condizioni sufficienti e necessarie complete e metodi calcolabili
Le principali insufficienze sono la verifica sperimentale non sufficientemente completa e la mancanza di considerazione della robustezza al rumore.
Indice di Raccomandazione: ⭐⭐⭐⭐☆ (4/5)
Profondità Teorica: ⭐⭐⭐⭐⭐
Valore Pratico: ⭐⭐⭐⭐
Completezza Sperimentale: ⭐⭐⭐
Qualità di Scrittura: ⭐⭐⭐⭐⭐
Innovatività: ⭐⭐⭐⭐⭐
Adatto per la pubblicazione su riviste di punta nel settore del controllo (come IEEE TAC, Automatica), con importante valore di riferimento per ricercatori nel controllo guidato dai dati e nella teoria dei sistemi.
3 H. J. van Waarde et al., "Data informativity: A new perspective on data-driven analysis and control," IEEE TAC, 2020. (Lavoro fondamentale sul quadro di informatività dei dati)
4 C. De Persis & P. Tesi, "Formulas for data-driven control: Stabilization, optimality, and robustness," IEEE TAC, 2019. (Primo metodo LMI per la stabilizzazione guidata dai dati)
12 J. Berberich et al., "Combining prior knowledge and data for robust controller design," IEEE TAC, 2022. (Conoscenze preliminari su intervalli di parametri)
25 J. Jia et al., "A unifying framework for strong structural controllability," IEEE TAC, 2020. (Teoria della controllabilità strutturale)
27 H. J. van Waarde & M. K. Camlibel, "A matrix Finsler's lemma with applications to data-driven control," CDC, 2021. (Teoria della stabilizzazione quadratica)