2025-11-23T10:46:16.032830

Strategy Templates for Almost-Sure and Positive Winning of Stochastic Parity Games towards Permissive and Resilient Control

Phalakarn, Pruekprasert, Hasuo

Stochastic games are fundamental in various applications, including the control of cyber-physical systems (CPS), where both controller and environment are modeled as players. Traditional algorithms typically aim to determine a single winning strategy to develop a controller. However, in CPS control and other domains, permissive controllers are essential, as they enable the system to adapt when additional constraints arise and remain resilient to runtime changes. This work generalizes the concept of (permissive winning) strategy templates, originally introduced by Anand et al. at TACAS and CAV 2023 for deterministic games, to incorporate stochastic games. These templates capture an infinite number of winning strategies, allowing for efficient strategy adaptation to system changes. We focus on two winning criteria (almost-sure and positive winning) and five winning objectives (safety, reachability, BÃ¼chi, co-BÃ¼chi, and parity). Our contributions include algorithms for constructing templates for each winning criterion and objective and a novel approach for extracting a winning strategy from a given template. Discussions on comparisons between templates and between strategy extraction methods are provided.

academic

Modelli di Strategia per la Vittoria Quasi-Certa e a Probabilità Positiva nei Giochi di Parità Stocastici verso il Controllo Permissivo e Resiliente

Informazioni Fondamentali

ID Articolo: 2409.08607
Titolo: Strategy Templates for Almost-Sure and Positive Winning of Stochastic Parity Games towards Permissive and Resilient Control
Autori: Kittiphon Phalakarn, Sasinee Pruekprasert, Ichiro Hasuo
Classificazione: eess.SY cs.LO cs.SY
Data di Pubblicazione: Settembre 2024 (arXiv v2: 16 ottobre 2025)
Link Articolo: https://arxiv.org/abs/2409.08607

Riassunto

I giochi stocastici svolgono un ruolo fondamentale in numerose applicazioni, in particolare nel controllo dei sistemi cibernetici-fisici (CPS), dove il controllore e l'ambiente sono modellati come partecipanti al gioco. Gli algoritmi tradizionali mirano tipicamente a determinare una singola strategia vincente per sviluppare il controllore. Tuttavia, nel controllo dei CPS e in altri ambiti, i controllori permissivi sono cruciali poiché consentono al sistema di adattarsi quando emergono vincoli aggiuntivi e di mantenere resilienza rispetto ai cambiamenti durante l'esecuzione. Questo lavoro generalizza il concetto di modelli di strategia dai giochi deterministici ai giochi stocastici, dove tali modelli sono in grado di catturare un numero infinito di strategie vincenti, permettendo un adattamento efficiente della strategia ai cambiamenti del sistema. Ci concentriamo su due criteri di vittoria (vittoria quasi-certa e vittoria a probabilità positiva) e cinque obiettivi di vittoria (sicurezza, raggiungibilità, Büchi, co-Büchi e parità).

Contesto di Ricerca e Motivazione

Contesto del Problema

Limitazioni degli Approcci Tradizionali: Gli algoritmi tradizionali di risoluzione dei giochi ricercano tipicamente una singola strategia vincente, senza considerare la permissività (permissiveness) della strategia
Esigenze delle Applicazioni Pratiche: Nel controllo dei sistemi cibernetici-fisici, sono necessari controllori permissivi per adattarsi a vincoli aggiuntivi e a cambiamenti durante l'esecuzione
Esigenze di Controllo Resiliente: I sistemi devono mantenere robustezza quando affrontano guasti o cambiamenti ambientali

Motivazione della Ricerca

Il concetto esistente di modelli di strategia si applica solo ai giochi deterministici, mancando di supporto per i giochi stocastici
È necessario un framework che possa catturare un numero infinito di strategie vincenti per supportare l'adattamento rapido della strategia
Nelle applicazioni pratiche come il controllo dei CPS, la permissività e la resilienza sono requisiti chiave

Contributi Principali

Algoritmo di Modello di Strategia Quasi-Certa: Propone algoritmi di costruzione di modelli di strategia quasi-certa per cinque obiettivi di vittoria (sicurezza, raggiungibilità, Büchi, co-Büchi, parità)
Modelli di Strategia a Probabilità Positiva: Sviluppa algoritmi di costruzione e composizione di modelli di strategia secondo il criterio di vittoria a probabilità positiva
Framework di Confronto dei Modelli: Fornisce discussioni comparative dei modelli basate su permissività e dimensione
Metodo di Estrazione della Strategia: Propone un nuovo metodo per estrarre strategie vincenti da un dato modello, bilanciando l'obiettivo di vittoria e la permissività

Dettagli Metodologici

Definizione del Compito

Definizione di Gioco Stocastico: G = (V, E, (V□, V○, V△)), dove:

V è l'insieme dei vertici, E è l'insieme degli archi
V□, V○, V△ rappresentano rispettivamente i vertici del giocatore Even, del giocatore Odd e del giocatore Random
Denominato gioco "2.5" giocatori, contenente due giocatori principali e un giocatore casuale

Definizione di Modello di Strategia: T = (P, L, C), dove:

P ⊆ E□ è l'insieme degli archi disabilitati
L ⊆ 2^E□ è l'insieme dei gruppi attivi
C ⊆ E□ è l'insieme degli archi co-attivi

Architettura del Modello

1. Costruzione di Modelli di Strategia Quasi-Certa

Obiettivo di Sicurezza (G X):

SafetyTemplate(G, X):
1. W□ ← νY.(X ∩ (Pre□(Y) ∪ Pre(Y)))
2. P ← Edges□(W□, V \ W□)
3. return (P, ∅, ∅)

Obiettivo di Raggiungibilità (F X):

ReachabilityTemplate(G, X):
1. A ← Attr'(X)
2. W□ ← Attr'□(A)
3. P ← Edges□(W□, V \ W□)
4. C ← Edges□(W□ \ A, W□ \ A)
5. return (P, ∅, C)

Obiettivo di Büchi (GF X): Costruisce gruppi attivi attraverso la funzione LiveGroups, garantendo che i percorsi visitino l'insieme obiettivo infinite volte.

Obiettivo di Parità:

Riduce il gioco stocastico a un gioco deterministico (utilizzando l'algoritmo Reduce)
Costruisce il modello di strategia del gioco deterministico
Trasforma il modello nel gioco stocastico

2. Costruzione di Modelli di Strategia a Probabilità Positiva

PositiveTemplate(G, φ):
1. Calcola W□, W○ e il modello quasi-certo T^(a)
2. W? ← V \ (W□ ∪ W○)
3. P^(p) ← P^(a) ∪ Edges□(W?, W○)
4. C^(p) ← C^(a) ∪ Edges□(W?, W?)
5. return T^(p) = (P^(p), L^(p), C^(p))

Punti di Innovazione Tecnica

Estensione delle Operazioni di Insieme: Introduce nuovi operatori di insieme che considerano il giocatore Random, come Pre△(X', X) e Attr'□(X)
Algoritmo di Composizione dei Modelli: Propone un meccanismo di rilevamento dei conflitti che ricalcola quando i modelli sono in conflitto
Estrazione Parametrizzata della Strategia: Utilizza parametri α e β per bilanciare la permissività e la velocità di raggiungimento dell'obiettivo
Estensione della Vittoria a Probabilità Positiva: Estende per la prima volta i modelli di strategia al criterio di vittoria a probabilità positiva

Configurazione Sperimentale

Verifica Teorica

L'articolo verifica principalmente la correttezza degli algoritmi attraverso prove teoriche, incluse:

Teoremi di correttezza per i vari algoritmi di costruzione dei modelli
Teoremi di permissività per i metodi di estrazione della strategia
Prove di correttezza per gli algoritmi di composizione dei modelli

Analisi della Complessità

Il tempo di esecuzione nel caso peggiore degli algoritmi di costruzione della strategia corrisponde agli algoritmi standard
La composizione dei modelli e l'estrazione della strategia possono essere eseguite efficientemente durante l'esecuzione

Risultati Sperimentali

Risultati Teorici

Teoremi 10-14: Provano la correttezza degli algoritmi di costruzione dei modelli di strategia per i vari obiettivi di vittoria

SafetyTemplate costruisce modelli quasi-certamente vincenti per G X
ReachabilityTemplate costruisce modelli quasi-certamente vincenti per F X
Analogamente applicabile ad altri obiettivi

Teorema 18: Il modello costruito da PositiveTemplate è sia quasi-certamente vincente che vincente a probabilità positiva

Teorema 27: Il metodo di estrazione parametrizzato è più permissivo del metodo Extract originale

Analisi della Permissività

Proposizione 22: Se P ⊇ P', L ⊇ L', C ⊇ C', allora T non è più permissivo di T'

Proposizione 23: Se T non è più permissivo di T' e T' è vincente, allora anche T è vincente

Potenziale di Applicazione Pratica

L'articolo indica che, sulla base dei risultati sperimentali dei giochi deterministici, i modelli di strategia possono realizzare un'accelerazione di almeno 2 volte nella sintesi incrementale e ridurre efficacemente il ricalcolo nel controllo tollerante ai guasti anche quando il 30% delle scelte è disabilitato.

Lavori Correlati

Teoria Classica della Permissività

Ramadge e Wonham (1987) hanno formalmente introdotto il concetto di permissività nel controllo supervisivo
Bernet et al. hanno provato l'esistenza di strategie massimamente permissive nei giochi di parità

Sviluppo dei Modelli di Strategia

Anand et al. hanno introdotto i modelli di strategia per i giochi deterministici in TACAS e CAV 2023
Questo lavoro è il primo a estendere i modelli di strategia ai giochi stocastici

Risoluzione di Giochi Stocastici

Metodo di riduzione dei giochi di parità stocastici di Chatterjee et al.
Operatori di insieme per giochi stocastici di Banerjee et al.

Conclusioni e Discussione

Conclusioni Principali

Estende con successo il concetto di modelli di strategia dai giochi deterministici ai giochi stocastici
Fornisce un framework algoritmico completo che copre due criteri di vittoria e cinque obiettivi di vittoria
Il nuovo metodo di estrazione della strategia aumenta la permissività mantenendo la correttezza

Limitazioni

Le strategie a probabilità positiva non garantiscono l'ottimalità della probabilità
L'implementazione dell'algoritmo e la verifica sperimentale rimangono da completare
Considera solo giochi a stati finiti

Direzioni Future

Costruire modelli che mantengono la stessa permissività ma con dimensione minore
Estendere a obiettivi definiti da formule di logica temporale metrica (MTL)
Applicazione a sistemi in tempo reale

Valutazione Approfondita

Punti di Forza

Contributo Teorico Significativo: Estende per la prima volta i modelli di strategia ai giochi stocastici con un framework teorico completo
Progettazione Algoritmica Razionale: Utilizza abilmente le operazioni di insieme e le tecniche di riduzione esistenti
Prospettive di Applicazione Ampie: Ha importanza pratica significativa per il controllo dei sistemi cibernetici-fisici
Rigore Matematico: Fornisce prove di correttezza complete

Carenze

Mancanza di Verifica Sperimentale: Principalmente lavoro teorico, mancanza di implementazione pratica e valutazione delle prestazioni
Problema di Ottimalità: Le strategie a probabilità positiva non garantiscono l'ottimalità
Analisi della Complessità Insufficiente: L'analisi della complessità computazionale pratica è piuttosto sommaria

Impatto

Valore Accademico: Fornisce nuovi strumenti e metodi per la teoria dei giochi stocastici
Valore Pratico: Fornisce fondamenti teorici per la progettazione di controllori permissivi
Scalabilità: Fornisce un buon framework di base per ricerche successive

Scenari Applicabili

Controllo robusto dei sistemi cibernetici-fisici
Sistemi di automazione che richiedono adattabilità
Progettazione di sistemi di controllo multi-obiettivo
Sistemi di controllo tolleranti ai guasti

Riferimenti Bibliografici

L'articolo cita 35 riferimenti correlati, principalmente coprenti:

Letteratura fondamentale sulla teoria dei giochi
Teoria del controllo supervisivo
Lavori correlati ai modelli di strategia
Algoritmi di risoluzione di giochi stocastici
Logica temporale lineare e model checking

Valutazione Complessiva: Questo è un articolo di ricerca teorica di alta qualità che estende con successo il concetto di modelli di strategia dai giochi deterministici ai giochi stocastici, fornendo fondamenti teorici importanti per il controllo permissivo e resiliente. Sebbene manchi di verifica sperimentale, il contributo teorico è significativo e ha un importante effetto propulsivo sul settore correlato.