2025-11-12T00:43:29.720804

Efficient Shield Synthesis via State-Space Transformation

Brorholt, Høeg-Petersen, Larsen et al.
We consider the problem of synthesizing safety strategies for control systems, also known as shields. Since the state space is infinite, shields are typically computed over a finite-state abstraction, with the most common abstraction being a rectangular grid. However, for many systems, such a grid does not align well with the safety property or the system dynamics. That is why a coarse grid is rarely sufficient, but a fine grid is typically computationally infeasible to obtain. In this paper, we show that appropriate state-space transformations can still allow to use a coarse grid at almost no computational overhead. We demonstrate in three case studies that our transformation-based synthesis outperforms a standard synthesis by several orders of magnitude. In the first two case studies, we use domain knowledge to select a suitable transformation. In the third case study, we instead report on results in engineering a transformation without domain knowledge.
academic

Sintesi Efficiente di Scudi via Trasformazione dello Spazio di Stato

Informazioni Fondamentali

  • ID Articolo: 2407.19911
  • Titolo: Efficient Shield Synthesis via State-Space Transformation
  • Autori: Asger Horn Brorholt, Andreas Holck Høeg-Petersen, Kim Guldstrand Larsen, Christian Schilling
  • Istituzione: Aalborg University, Danimarca
  • Classificazione: cs.LO cs.AI cs.LG cs.SY eess.SY
  • Data di Pubblicazione: Luglio 2024 (preprint arXiv)
  • Link Articolo: https://arxiv.org/abs/2407.19911

Riassunto

Questo articolo affronta il problema della sintesi di strategie di sicurezza per sistemi di controllo, noto anche come sintesi di scudi. Poiché lo spazio di stato è infinito, gli scudi vengono generalmente calcolati su astrazioni di stato finito, con la griglia rettangolare come astrazione più comune. Tuttavia, per molti sistemi, questa griglia si adatta male alle proprietà di sicurezza o alla dinamica del sistema. Griglie grossolane sono spesso insufficienti, mentre griglie fini sono generalmente computazionalmente non fattibili. L'articolo dimostra che trasformazioni dello spazio di stato appropriate consentono di utilizzare griglie grossolane con un sovraccarico computazionale quasi nullo. Tre studi di caso dimostrano che il metodo di sintesi basato su trasformazioni supera il metodo di sintesi standard di diversi ordini di grandezza.

Contesto di Ricerca e Motivazione

Definizione del Problema

Il problema centrale affrontato da questa ricerca è come sintetizzare efficientemente strategie di sicurezza (scudi) per sistemi di controllo. Nei sistemi ciber-fisici, i controllori digitali devono garantire la sicurezza del sistema, il che ha motivato lo sviluppo di metodi automatici di costruzione di controllori.

Importanza

  1. Criticità della Sicurezza: Molti sistemi ciber-fisici sono critici per la sicurezza e richiedono garanzie formali di sicurezza
  2. Complementarità dei Metodi: L'apprendimento per rinforzo fornisce ottimalità ma manca di garanzie di sicurezza, mentre la sintesi reattiva fornisce garanzie di sicurezza ma manca di ottimalità
  3. Framework di Scudo: Combina i vantaggi di entrambi gli approcci, prevenendo azioni non sicure durante il processo di apprendimento attraverso lo scudo

Limitazioni dei Metodi Esistenti

  1. Problema dell'Astrazione a Griglia: Le griglie rettangolari spesso non si adattano bene alla dinamica del sistema e alle proprietà di sicurezza
  2. Complessità Computazionale: Griglie grossolane hanno precisione insufficiente, griglie fini sono computazionalmente non fattibili
  3. Esplosione dello Spazio di Stato: Con l'aumento dei requisiti di precisione, lo spazio di stato cresce esponenzialmente

Motivazione della Ricerca

Attraverso trasformazioni dello spazio di stato, allineare meglio la griglia alla dinamica del sistema nel nuovo spazio di stato, migliorando così la qualità della sintesi mantenendo l'efficienza computazionale.

Contributi Principali

  1. Propone un metodo di sintesi di scudi basato su trasformazione dello spazio di stato, in grado di ridurre significativamente il numero di celle di griglia necessarie
  2. Dimostra la correttezza teorica del metodo di trasformazione, incluso il trasferimento delle garanzie di sicurezza dallo spazio trasformato allo spazio originale
  3. Valida l'efficacia del metodo in tre studi di caso, con miglioramenti di prestazioni di diversi ordini di grandezza
  4. Fornisce un metodo di ingegneria della trasformazione senza conoscenza del dominio, estendendo l'applicabilità del metodo
  5. Realizza l'integrazione con l'apprendimento per rinforzo, dimostrando il valore pratico dell'applicazione

Spiegazione Dettagliata del Metodo

Definizione del Compito

Dato un sistema di controllo (S,Act,δ)(S, Act, δ), dove:

  • SRdS ⊆ \mathbb{R}^d: spazio di stato d-dimensionale limitato
  • ActAct: insieme finito di azioni di controllo
  • δ:S×Act2Sδ: S × Act → 2^S: funzione successore

Obiettivo: sintetizzare una strategia di sicurezza σ:S2Actσ: S → 2^{Act} per la proprietà di sicurezza φSφ ⊆ S

Architettura Principale

1. Trasformazione dello Spazio di Stato

  • Funzione di trasformazione: f:STf: S → T, che mappa lo spazio di stato originale SS nello spazio trasformato TT
  • Trasformazione inversa: f1:T2Sf^{-1}: T → 2^S, definita come f1(t)={sSf(s)=t}f^{-1}(t) = \{s ∈ S | f(s) = t\}
  • Compatibilità con la Griglia: La trasformazione dovrebbe allineare i bordi della griglia con i confini decisionali

2. Funzione Successore nello Spazio Trasformato

Nel spazio trasformato TT definire il nuovo sistema di controllo (T,Act,δT)(T, Act, δ_T): δT(t,a)=f(δS(f1(t),a))δ_T(t, a) = f(δ_S(f^{-1}(t), a))

3. Estensione della Griglia

L'insieme di celle controllabili CφfC_φ^f è definito come: Cφf=f(φ)G{CGaAct.C.CaCCCφf}C_φ^f = ⌊f(φ)⌋_G ∩ \{C ∈ G | ∃a ∈ Act. ∀C'. C \xrightarrow{a} C' ⟹ C' ∈ C_φ^f\}

Punti di Innovazione Tecnica

1. Strategie di Allineamento della Griglia

  • Trasformazione in Coordinate Polari: Per traiettorie circolari e ostacoli, utilizzare coordinate polari (θ,r)(θ, r)
  • Trasformazione Energetica: Utilizzare invarianti del sistema (come l'energia meccanica) come dimensione di trasformazione
  • Adattamento Polinomiale: Generare automaticamente trasformazioni adattando i confini decisionali

2. Garanzie Teoriche

Teorema 1: Correttezza del metodo di trasformazione

  • Strategia di sicurezza nello spazio trasformato σY(t)=σG([t]G)σ_Y(t) = σ_G([t]_G)
  • Strategia di sicurezza nello spazio originale σX(s)=σG([f(s)]G)σ_X(s) = σ_G([f(s)]_G)

3. Ottimizzazione Computazionale

  • Calcolo in Tre Fasi: f1δSff^{-1} → δ_S → f
  • Estensione di Insiemi: Gestione naturale di trasformazioni non biunivoche
  • Calcolo su Richiesta: Evitare il precalcolo del sistema di transizione completo

Configurazione Sperimentale

Studi di Caso

1. Modello di Satellite

  • Spazio di Stato: (x,y)[2,2]×[2,2](x, y) ∈ [-2, 2] × [-2, 2]
  • Trasformazione: Coordinate polari f(x,y)=(atan2(y,x),x2+y2)Tf(x, y) = (atan2(y, x), \sqrt{x^2 + y^2})^T
  • Azioni: {ahead,out,in}\{ahead, out, in\}
  • Vincoli di Sicurezza: Evitamento di ostacoli + limitazione della distanza

2. Modello di Palla Rimbalzante

  • Spazio di Stato: (v,p)[13,13]×[0,8](v, p) ∈ [-13, 13] × [0, 8]
  • Trasformazione: Energia meccanica f(v,p)=(mgp+12mv2,v)Tf(v, p) = (mgp + \frac{1}{2}mv^2, v)^T
  • Obiettivo: Mantenere la palla in rimbalzo continuo

3. Modello di Pendolo Invertito

  • Spazio di Stato: (θ,ω)[2.095,2.095]×[3,3](θ, ω) ∈ [-2.095, 2.095] × [-3, 3]
  • Trasformazione: Adattamento polinomiale f(θ,ω)=(θ,ωp(θ))Tf(θ, ω) = (θ, ω - p(θ))^T
  • Obiettivo: Mantenere l'asta verticale

Metriche di Valutazione

  • Numero di celle di griglia: Misura della complessità computazionale
  • Tempo di calcolo: Efficienza della sintesi
  • Numero di nodi dell'albero decisionale: Complessità della rappresentazione della strategia
  • Ricompensa Cumulativa: Prestazioni dell'apprendimento per rinforzo

Risultati Sperimentali

Risultati Principali

Riduzione della Dimensione della Griglia

ModelloCelle Spazio OriginaleCelle Spazio TrasformatoRiduzione
Satellite176,40027,3006.5×
Palla Rimbalzante520,000650800×
Pendolo Invertito9004002.25×

Miglioramento del Tempo di Calcolo

  • Modello di Satellite: Ridotto da 2 minuti 41 secondi a 10 secondi
  • Modello di Palla Rimbalzante: Ridotto da 19 minuti a 1.3 secondi (tre ordini di grandezza)
  • Pendolo Invertito: Ridotto da 512 millisecondi a 244 millisecondi

Rappresentazione dell'Albero Decisionale

Ulteriore riduzione dei requisiti di memoria attraverso rappresentazione ad albero decisionale:

  • Satellite: ridotto da 4,913 nodi a 544 nodi
  • Palla Rimbalzante: ridotto da 940 nodi a 49 nodi
  • Pendolo Invertito: ridotto da 99 nodi a 32 nodi

Prestazioni dell'Apprendimento per Rinforzo

Nel confronto della ricompensa cumulativa su 1000 episodi:

  • Modello di Satellite: Lo scudo trasformato raggiunge la ricompensa massima di 1.499
  • Modello di Palla Rimbalzante: Lo scudo trasformato raggiunge il costo minimo di 36.593
  • Pendolo Invertito: Lo scudo trasformato raggiunge il costo minimo di 0.000

I risultati dimostrano che lo scudo trasformato non solo è computazionalmente più efficiente, ma anche superiore nelle prestazioni pratiche.

Scoperte Importanti

  1. Scelta della Trasformazione Critica: Una trasformazione appropriata può portare a miglioramenti di ordini di grandezza
  2. Utilizzo di Invarianti: L'utilizzo di invarianti del sistema (come energia, momento angolare) è molto efficace
  3. Trasformazione Automatica Fattibile: Il metodo di ingegneria della trasformazione senza conoscenza del dominio è fattibile
  4. Miglioramento delle Prestazioni: La trasformazione non solo migliora l'efficienza ma anche le prestazioni del controllore finale

Lavori Correlati

Sintesi di Controllori Astratti

  • Metodi Tradizionali: Sistemi di transizione simbolici basati su griglie rettangolari regolari
  • Astrazioni Multilivello: Metodi multilivello che utilizzano griglie di diverse dimensioni
  • Astrazione Ellissoidale: Recenti sforzi che utilizzano astrazioni a griglia ellissoidale

Tecniche di Scudo

  • Uppaal Stratego: Implementazione e applicazione dello strumento
  • Scudo Probabilistico: Apprendimento per rinforzo sicuro utilizzando scudi probabilistici
  • Controllo Predittivo del Modello: Concetti simili nel controllo predittivo del modello sicuro

Trasformazione dello Spazio di Stato Correlata

  • Interpretazione Astratta: Funzioni di astrazione e concretizzazione nelle connessioni di Galois
  • Riduzione dell'Ordine del Modello: Metodi di approssimazione per ridurre la dimensionalità del sistema
  • Bisimulazione: Riduzione dello spazio di stato basata su bisimulazione

Conclusioni e Discussione

Conclusioni Principali

  1. La trasformazione dello spazio di stato è uno strumento potente per la sintesi di scudi, in grado di migliorare significativamente l'efficienza computazionale
  2. La correttezza teorica è garantita, le proprietà di sicurezza si trasferiscono correttamente dallo spazio trasformato allo spazio originale
  3. Il valore pratico dell'applicazione è elevato, non solo migliora l'efficienza computazionale ma anche le prestazioni di controllo
  4. Il metodo ha generalità, è applicabile a vari tipi di sistemi di controllo

Limitazioni

  1. Dipendenza dalla Scelta della Trasformazione: La qualità della trasformazione influisce direttamente sull'efficacia del metodo
  2. Requisiti di Conoscenza del Dominio: I primi due casi di studio richiedono conoscenza specialistica del dominio
  3. Trasformazioni Non Biunivoche: Possono introdurre errori di approssimazione aggiuntivi
  4. Ambito di Applicabilità: Principalmente applicabile a sistemi per i quali è possibile trovare trasformazioni appropriate

Direzioni Future

  1. Scoperta Automatica di Trasformazioni: Sviluppare metodi di generazione di trasformazioni più universali
  2. Combinazione di Trasformazioni Multiple: Ricercare l'uso combinato di famiglie di trasformazioni
  3. Trasformazioni Online: Esplorare trasformazioni adattive in fase di esecuzione
  4. Integrazione Estesa: Combinare con metodi ortogonali come astrazioni multilivello

Valutazione Approfondita

Punti di Forza

  1. Forte Innovazione: Prima applicazione sistematica della trasformazione dello spazio di stato alla sintesi di scudi
  2. Completezza Teorica: Fornisce analisi teorica completa e prove di correttezza
  3. Sperimentazione Adeguata: Tre studi di caso di diverso tipo verificano l'ampia applicabilità del metodo
  4. Alto Valore Pratico: I miglioramenti di prestazioni di ordini di grandezza hanno significato pratico importante
  5. Generalità del Metodo: Può essere combinato ortogonalmente con metodi di astrazione a griglia esistenti

Insufficienze

  1. Sfida nella Progettazione della Trasformazione: Trovare trasformazioni appropriate per sistemi complessi rimane difficile
  2. Grado di Automazione: Il metodo automatico nel terzo caso di studio non è ancora sufficientemente maturo
  3. Analisi Teorica: Manca una guida teorica su quando esistono buone trasformazioni
  4. Confronto di Base: Il confronto con altri metodi non basati su griglia non è sufficientemente completo

Impatto

  1. Contributo Accademico: Fornisce una nuova direzione di ricerca per il campo della sintesi di sicurezza dei sistemi di controllo
  2. Valore Pratico: I significativi miglioramenti di prestazioni rendono possibile la sintesi di sicurezza per sistemi più complessi
  3. Riproducibilità: Fornisce implementazione completa e pacchetto di riproduzione
  4. Estensibilità: Il metodo può essere esteso ad altre tecniche di astrazione e sintesi

Scenari di Applicazione

  1. Sistemi con Struttura Geometrica: Come navigazione robotica, controllo di veicoli spaziali
  2. Sistemi con Invarianti Fisici: Come sistemi con conservazione dell'energia
  3. Applicazioni che Richiedono Sintesi di Sicurezza Efficiente: Sistemi embedded, controllo in tempo reale
  4. Applicazioni di Apprendimento per Rinforzo Sicuro: Sistemi di apprendimento che richiedono garanzie di sicurezza

Bibliografia

L'articolo cita 31 lavori correlati, coprendo importanti contributi in più campi tra cui teoria del controllo, metodi formali, apprendimento per rinforzo e interpretazione astratta, fornendo una base teorica solida per la ricerca.


Valutazione Complessiva: Questo è un articolo di ricerca di alta qualità che propone una soluzione innovativa per affrontare le sfide computazionali nella sintesi di scudi. Il metodo ha una base teorica forte e un valore pratico significativo, fornendo un contributo importante al campo della sintesi di sicurezza per sistemi di controllo.