2025-11-12T00:43:29.720804

Efficient Shield Synthesis via State-Space Transformation

Brorholt, HÃ¸eg-Petersen, Larsen et al.

We consider the problem of synthesizing safety strategies for control systems, also known as shields. Since the state space is infinite, shields are typically computed over a finite-state abstraction, with the most common abstraction being a rectangular grid. However, for many systems, such a grid does not align well with the safety property or the system dynamics. That is why a coarse grid is rarely sufficient, but a fine grid is typically computationally infeasible to obtain. In this paper, we show that appropriate state-space transformations can still allow to use a coarse grid at almost no computational overhead. We demonstrate in three case studies that our transformation-based synthesis outperforms a standard synthesis by several orders of magnitude. In the first two case studies, we use domain knowledge to select a suitable transformation. In the third case study, we instead report on results in engineering a transformation without domain knowledge.

academic

Sintesi Efficiente di Scudi via Trasformazione dello Spazio di Stato

Informazioni Fondamentali

ID Articolo: 2407.19911
Titolo: Efficient Shield Synthesis via State-Space Transformation
Autori: Asger Horn Brorholt, Andreas Holck Høeg-Petersen, Kim Guldstrand Larsen, Christian Schilling
Istituzione: Aalborg University, Danimarca
Classificazione: cs.LO cs.AI cs.LG cs.SY eess.SY
Data di Pubblicazione: Luglio 2024 (preprint arXiv)
Link Articolo: https://arxiv.org/abs/2407.19911

Riassunto

Questo articolo affronta il problema della sintesi di strategie di sicurezza per sistemi di controllo, noto anche come sintesi di scudi. Poiché lo spazio di stato è infinito, gli scudi vengono generalmente calcolati su astrazioni di stato finito, con la griglia rettangolare come astrazione più comune. Tuttavia, per molti sistemi, questa griglia si adatta male alle proprietà di sicurezza o alla dinamica del sistema. Griglie grossolane sono spesso insufficienti, mentre griglie fini sono generalmente computazionalmente non fattibili. L'articolo dimostra che trasformazioni dello spazio di stato appropriate consentono di utilizzare griglie grossolane con un sovraccarico computazionale quasi nullo. Tre studi di caso dimostrano che il metodo di sintesi basato su trasformazioni supera il metodo di sintesi standard di diversi ordini di grandezza.

Contesto di Ricerca e Motivazione

Definizione del Problema

Il problema centrale affrontato da questa ricerca è come sintetizzare efficientemente strategie di sicurezza (scudi) per sistemi di controllo. Nei sistemi ciber-fisici, i controllori digitali devono garantire la sicurezza del sistema, il che ha motivato lo sviluppo di metodi automatici di costruzione di controllori.

Importanza

Criticità della Sicurezza: Molti sistemi ciber-fisici sono critici per la sicurezza e richiedono garanzie formali di sicurezza
Complementarità dei Metodi: L'apprendimento per rinforzo fornisce ottimalità ma manca di garanzie di sicurezza, mentre la sintesi reattiva fornisce garanzie di sicurezza ma manca di ottimalità
Framework di Scudo: Combina i vantaggi di entrambi gli approcci, prevenendo azioni non sicure durante il processo di apprendimento attraverso lo scudo

Limitazioni dei Metodi Esistenti

Problema dell'Astrazione a Griglia: Le griglie rettangolari spesso non si adattano bene alla dinamica del sistema e alle proprietà di sicurezza
Complessità Computazionale: Griglie grossolane hanno precisione insufficiente, griglie fini sono computazionalmente non fattibili
Esplosione dello Spazio di Stato: Con l'aumento dei requisiti di precisione, lo spazio di stato cresce esponenzialmente

Motivazione della Ricerca

Attraverso trasformazioni dello spazio di stato, allineare meglio la griglia alla dinamica del sistema nel nuovo spazio di stato, migliorando così la qualità della sintesi mantenendo l'efficienza computazionale.

Contributi Principali

Propone un metodo di sintesi di scudi basato su trasformazione dello spazio di stato, in grado di ridurre significativamente il numero di celle di griglia necessarie
Dimostra la correttezza teorica del metodo di trasformazione, incluso il trasferimento delle garanzie di sicurezza dallo spazio trasformato allo spazio originale
Valida l'efficacia del metodo in tre studi di caso, con miglioramenti di prestazioni di diversi ordini di grandezza
Fornisce un metodo di ingegneria della trasformazione senza conoscenza del dominio, estendendo l'applicabilità del metodo
Realizza l'integrazione con l'apprendimento per rinforzo, dimostrando il valore pratico dell'applicazione

Spiegazione Dettagliata del Metodo

Definizione del Compito

Dato un sistema di controllo $(S, Act, δ)$ , dove:

$S ⊆ \mathbb{R}^d$ : spazio di stato d-dimensionale limitato
$Act$ : insieme finito di azioni di controllo
$δ: S × Act → 2^S$ : funzione successore

Obiettivo: sintetizzare una strategia di sicurezza $σ: S → 2^{Act}$ per la proprietà di sicurezza $φ ⊆ S$

Architettura Principale

1. Trasformazione dello Spazio di Stato

Funzione di trasformazione: $f: S → T$ , che mappa lo spazio di stato originale $S$ nello spazio trasformato $T$
Trasformazione inversa: $f^{-1}: T → 2^S$ , definita come $f^{-1}(t) = \{s ∈ S | f(s) = t\}$
Compatibilità con la Griglia: La trasformazione dovrebbe allineare i bordi della griglia con i confini decisionali

2. Funzione Successore nello Spazio Trasformato

Nel spazio trasformato $T$ definire il nuovo sistema di controllo $(T, Act, δ_T)$ : $δ_T(t, a) = f(δ_S(f^{-1}(t), a))$

3. Estensione della Griglia

L'insieme di celle controllabili $C_φ^f$ è definito come: $C_φ^f = ⌊f(φ)⌋_G ∩ \{C ∈ G | ∃a ∈ Act. ∀C'. C \xrightarrow{a} C' ⟹ C' ∈ C_φ^f\}$

Punti di Innovazione Tecnica

1. Strategie di Allineamento della Griglia

Trasformazione in Coordinate Polari: Per traiettorie circolari e ostacoli, utilizzare coordinate polari $(θ, r)$
Trasformazione Energetica: Utilizzare invarianti del sistema (come l'energia meccanica) come dimensione di trasformazione
Adattamento Polinomiale: Generare automaticamente trasformazioni adattando i confini decisionali

2. Garanzie Teoriche

Teorema 1: Correttezza del metodo di trasformazione

Strategia di sicurezza nello spazio trasformato $σ_Y(t) = σ_G([t]_G)$
Strategia di sicurezza nello spazio originale $σ_X(s) = σ_G([f(s)]_G)$

3. Ottimizzazione Computazionale

Calcolo in Tre Fasi: $f^{-1} → δ_S → f$
Estensione di Insiemi: Gestione naturale di trasformazioni non biunivoche
Calcolo su Richiesta: Evitare il precalcolo del sistema di transizione completo

Configurazione Sperimentale

Studi di Caso

1. Modello di Satellite

Spazio di Stato: $(x, y) ∈ [-2, 2] × [-2, 2]$
Trasformazione: Coordinate polari $f(x, y) = (atan2(y, x), \sqrt{x^2 + y^2})^T$
Azioni: $\{ahead, out, in\}$
Vincoli di Sicurezza: Evitamento di ostacoli + limitazione della distanza

2. Modello di Palla Rimbalzante

Spazio di Stato: $(v, p) ∈ [-13, 13] × [0, 8]$
Trasformazione: Energia meccanica $f(v, p) = (mgp + \frac{1}{2}mv^2, v)^T$
Obiettivo: Mantenere la palla in rimbalzo continuo

3. Modello di Pendolo Invertito

Spazio di Stato: $(θ, ω) ∈ [-2.095, 2.095] × [-3, 3]$
Trasformazione: Adattamento polinomiale $f(θ, ω) = (θ, ω - p(θ))^T$
Obiettivo: Mantenere l'asta verticale

Metriche di Valutazione

Numero di celle di griglia: Misura della complessità computazionale
Tempo di calcolo: Efficienza della sintesi
Numero di nodi dell'albero decisionale: Complessità della rappresentazione della strategia
Ricompensa Cumulativa: Prestazioni dell'apprendimento per rinforzo

Risultati Sperimentali

Risultati Principali

Riduzione della Dimensione della Griglia

Modello	Celle Spazio Originale	Celle Spazio Trasformato	Riduzione
Satellite	176,400	27,300	6.5×
Palla Rimbalzante	520,000	650	800×
Pendolo Invertito	900	400	2.25×

Miglioramento del Tempo di Calcolo

Modello di Satellite: Ridotto da 2 minuti 41 secondi a 10 secondi
Modello di Palla Rimbalzante: Ridotto da 19 minuti a 1.3 secondi (tre ordini di grandezza)
Pendolo Invertito: Ridotto da 512 millisecondi a 244 millisecondi

Rappresentazione dell'Albero Decisionale

Ulteriore riduzione dei requisiti di memoria attraverso rappresentazione ad albero decisionale:

Satellite: ridotto da 4,913 nodi a 544 nodi
Palla Rimbalzante: ridotto da 940 nodi a 49 nodi
Pendolo Invertito: ridotto da 99 nodi a 32 nodi

Prestazioni dell'Apprendimento per Rinforzo

Nel confronto della ricompensa cumulativa su 1000 episodi:

Modello di Satellite: Lo scudo trasformato raggiunge la ricompensa massima di 1.499
Modello di Palla Rimbalzante: Lo scudo trasformato raggiunge il costo minimo di 36.593
Pendolo Invertito: Lo scudo trasformato raggiunge il costo minimo di 0.000

I risultati dimostrano che lo scudo trasformato non solo è computazionalmente più efficiente, ma anche superiore nelle prestazioni pratiche.

Scoperte Importanti

Scelta della Trasformazione Critica: Una trasformazione appropriata può portare a miglioramenti di ordini di grandezza
Utilizzo di Invarianti: L'utilizzo di invarianti del sistema (come energia, momento angolare) è molto efficace
Trasformazione Automatica Fattibile: Il metodo di ingegneria della trasformazione senza conoscenza del dominio è fattibile
Miglioramento delle Prestazioni: La trasformazione non solo migliora l'efficienza ma anche le prestazioni del controllore finale

Lavori Correlati

Sintesi di Controllori Astratti

Metodi Tradizionali: Sistemi di transizione simbolici basati su griglie rettangolari regolari
Astrazioni Multilivello: Metodi multilivello che utilizzano griglie di diverse dimensioni
Astrazione Ellissoidale: Recenti sforzi che utilizzano astrazioni a griglia ellissoidale

Tecniche di Scudo

Uppaal Stratego: Implementazione e applicazione dello strumento
Scudo Probabilistico: Apprendimento per rinforzo sicuro utilizzando scudi probabilistici
Controllo Predittivo del Modello: Concetti simili nel controllo predittivo del modello sicuro

Trasformazione dello Spazio di Stato Correlata

Interpretazione Astratta: Funzioni di astrazione e concretizzazione nelle connessioni di Galois
Riduzione dell'Ordine del Modello: Metodi di approssimazione per ridurre la dimensionalità del sistema
Bisimulazione: Riduzione dello spazio di stato basata su bisimulazione

Conclusioni e Discussione

Conclusioni Principali

La trasformazione dello spazio di stato è uno strumento potente per la sintesi di scudi, in grado di migliorare significativamente l'efficienza computazionale
La correttezza teorica è garantita, le proprietà di sicurezza si trasferiscono correttamente dallo spazio trasformato allo spazio originale
Il valore pratico dell'applicazione è elevato, non solo migliora l'efficienza computazionale ma anche le prestazioni di controllo
Il metodo ha generalità, è applicabile a vari tipi di sistemi di controllo

Limitazioni

Dipendenza dalla Scelta della Trasformazione: La qualità della trasformazione influisce direttamente sull'efficacia del metodo
Requisiti di Conoscenza del Dominio: I primi due casi di studio richiedono conoscenza specialistica del dominio
Trasformazioni Non Biunivoche: Possono introdurre errori di approssimazione aggiuntivi
Ambito di Applicabilità: Principalmente applicabile a sistemi per i quali è possibile trovare trasformazioni appropriate

Direzioni Future

Scoperta Automatica di Trasformazioni: Sviluppare metodi di generazione di trasformazioni più universali
Combinazione di Trasformazioni Multiple: Ricercare l'uso combinato di famiglie di trasformazioni
Trasformazioni Online: Esplorare trasformazioni adattive in fase di esecuzione
Integrazione Estesa: Combinare con metodi ortogonali come astrazioni multilivello

Valutazione Approfondita

Punti di Forza

Forte Innovazione: Prima applicazione sistematica della trasformazione dello spazio di stato alla sintesi di scudi
Completezza Teorica: Fornisce analisi teorica completa e prove di correttezza
Sperimentazione Adeguata: Tre studi di caso di diverso tipo verificano l'ampia applicabilità del metodo
Alto Valore Pratico: I miglioramenti di prestazioni di ordini di grandezza hanno significato pratico importante
Generalità del Metodo: Può essere combinato ortogonalmente con metodi di astrazione a griglia esistenti

Insufficienze

Sfida nella Progettazione della Trasformazione: Trovare trasformazioni appropriate per sistemi complessi rimane difficile
Grado di Automazione: Il metodo automatico nel terzo caso di studio non è ancora sufficientemente maturo
Analisi Teorica: Manca una guida teorica su quando esistono buone trasformazioni
Confronto di Base: Il confronto con altri metodi non basati su griglia non è sufficientemente completo

Impatto

Contributo Accademico: Fornisce una nuova direzione di ricerca per il campo della sintesi di sicurezza dei sistemi di controllo
Valore Pratico: I significativi miglioramenti di prestazioni rendono possibile la sintesi di sicurezza per sistemi più complessi
Riproducibilità: Fornisce implementazione completa e pacchetto di riproduzione
Estensibilità: Il metodo può essere esteso ad altre tecniche di astrazione e sintesi

Scenari di Applicazione

Sistemi con Struttura Geometrica: Come navigazione robotica, controllo di veicoli spaziali
Sistemi con Invarianti Fisici: Come sistemi con conservazione dell'energia
Applicazioni che Richiedono Sintesi di Sicurezza Efficiente: Sistemi embedded, controllo in tempo reale
Applicazioni di Apprendimento per Rinforzo Sicuro: Sistemi di apprendimento che richiedono garanzie di sicurezza

Bibliografia

L'articolo cita 31 lavori correlati, coprendo importanti contributi in più campi tra cui teoria del controllo, metodi formali, apprendimento per rinforzo e interpretazione astratta, fornendo una base teorica solida per la ricerca.

Valutazione Complessiva: Questo è un articolo di ricerca di alta qualità che propone una soluzione innovativa per affrontare le sfide computazionali nella sintesi di scudi. Il metodo ha una base teorica forte e un valore pratico significativo, fornendo un contributo importante al campo della sintesi di sicurezza per sistemi di controllo.