Strategy Templates for Almost-Sure and Positive Winning of Stochastic Parity Games towards Permissive and Resilient Control
Phalakarn, Pruekprasert, Hasuo
Stochastic games are fundamental in various applications, including the control of cyber-physical systems (CPS), where both controller and environment are modeled as players. Traditional algorithms typically aim to determine a single winning strategy to develop a controller. However, in CPS control and other domains, permissive controllers are essential, as they enable the system to adapt when additional constraints arise and remain resilient to runtime changes. This work generalizes the concept of (permissive winning) strategy templates, originally introduced by Anand et al. at TACAS and CAV 2023 for deterministic games, to incorporate stochastic games. These templates capture an infinite number of winning strategies, allowing for efficient strategy adaptation to system changes. We focus on two winning criteria (almost-sure and positive winning) and five winning objectives (safety, reachability, Büchi, co-Büchi, and parity). Our contributions include algorithms for constructing templates for each winning criterion and objective and a novel approach for extracting a winning strategy from a given template. Discussions on comparisons between templates and between strategy extraction methods are provided.
academic
Modelli di Strategia per la Vittoria Quasi-Certa e a Probabilità Positiva nei Giochi di Parità Stocastici verso il Controllo Permissivo e Resiliente
I giochi stocastici svolgono un ruolo fondamentale in numerose applicazioni, in particolare nel controllo dei sistemi cibernetici-fisici (CPS), dove il controllore e l'ambiente sono modellati come partecipanti al gioco. Gli algoritmi tradizionali mirano tipicamente a determinare una singola strategia vincente per sviluppare il controllore. Tuttavia, nel controllo dei CPS e in altri ambiti, i controllori permissivi sono cruciali poiché consentono al sistema di adattarsi quando emergono vincoli aggiuntivi e di mantenere resilienza rispetto ai cambiamenti durante l'esecuzione. Questo lavoro generalizza il concetto di modelli di strategia dai giochi deterministici ai giochi stocastici, dove tali modelli sono in grado di catturare un numero infinito di strategie vincenti, permettendo un adattamento efficiente della strategia ai cambiamenti del sistema. Ci concentriamo su due criteri di vittoria (vittoria quasi-certa e vittoria a probabilità positiva) e cinque obiettivi di vittoria (sicurezza, raggiungibilità, Büchi, co-Büchi e parità).
Limitazioni degli Approcci Tradizionali: Gli algoritmi tradizionali di risoluzione dei giochi ricercano tipicamente una singola strategia vincente, senza considerare la permissività (permissiveness) della strategia
Esigenze delle Applicazioni Pratiche: Nel controllo dei sistemi cibernetici-fisici, sono necessari controllori permissivi per adattarsi a vincoli aggiuntivi e a cambiamenti durante l'esecuzione
Esigenze di Controllo Resiliente: I sistemi devono mantenere robustezza quando affrontano guasti o cambiamenti ambientali
Algoritmo di Modello di Strategia Quasi-Certa: Propone algoritmi di costruzione di modelli di strategia quasi-certa per cinque obiettivi di vittoria (sicurezza, raggiungibilità, Büchi, co-Büchi, parità)
Modelli di Strategia a Probabilità Positiva: Sviluppa algoritmi di costruzione e composizione di modelli di strategia secondo il criterio di vittoria a probabilità positiva
Framework di Confronto dei Modelli: Fornisce discussioni comparative dei modelli basate su permissività e dimensione
Metodo di Estrazione della Strategia: Propone un nuovo metodo per estrarre strategie vincenti da un dato modello, bilanciando l'obiettivo di vittoria e la permissività
ReachabilityTemplate(G, X):
1. A ← Attr'(X)
2. W□ ← Attr'□(A)
3. P ← Edges□(W□, V \ W□)
4. C ← Edges□(W□ \ A, W□ \ A)
5. return (P, ∅, C)
Obiettivo di Büchi (GF X):
Costruisce gruppi attivi attraverso la funzione LiveGroups, garantendo che i percorsi visitino l'insieme obiettivo infinite volte.
Obiettivo di Parità:
Riduce il gioco stocastico a un gioco deterministico (utilizzando l'algoritmo Reduce)
Costruisce il modello di strategia del gioco deterministico
L'articolo indica che, sulla base dei risultati sperimentali dei giochi deterministici, i modelli di strategia possono realizzare un'accelerazione di almeno 2 volte nella sintesi incrementale e ridurre efficacemente il ricalcolo nel controllo tollerante ai guasti anche quando il 30% delle scelte è disabilitato.
L'articolo cita 35 riferimenti correlati, principalmente coprenti:
Letteratura fondamentale sulla teoria dei giochi
Teoria del controllo supervisivo
Lavori correlati ai modelli di strategia
Algoritmi di risoluzione di giochi stocastici
Logica temporale lineare e model checking
Valutazione Complessiva: Questo è un articolo di ricerca teorica di alta qualità che estende con successo il concetto di modelli di strategia dai giochi deterministici ai giochi stocastici, fornendo fondamenti teorici importanti per il controllo permissivo e resiliente. Sebbene manchi di verifica sperimentale, il contributo teorico è significativo e ha un importante effetto propulsivo sul settore correlato.