2025-11-23T10:46:16.032830

Strategy Templates for Almost-Sure and Positive Winning of Stochastic Parity Games towards Permissive and Resilient Control

Phalakarn, Pruekprasert, Hasuo
Stochastic games are fundamental in various applications, including the control of cyber-physical systems (CPS), where both controller and environment are modeled as players. Traditional algorithms typically aim to determine a single winning strategy to develop a controller. However, in CPS control and other domains, permissive controllers are essential, as they enable the system to adapt when additional constraints arise and remain resilient to runtime changes. This work generalizes the concept of (permissive winning) strategy templates, originally introduced by Anand et al. at TACAS and CAV 2023 for deterministic games, to incorporate stochastic games. These templates capture an infinite number of winning strategies, allowing for efficient strategy adaptation to system changes. We focus on two winning criteria (almost-sure and positive winning) and five winning objectives (safety, reachability, Büchi, co-Büchi, and parity). Our contributions include algorithms for constructing templates for each winning criterion and objective and a novel approach for extracting a winning strategy from a given template. Discussions on comparisons between templates and between strategy extraction methods are provided.
academic

Modelli di Strategia per la Vittoria Quasi-Certa e a Probabilità Positiva nei Giochi di Parità Stocastici verso il Controllo Permissivo e Resiliente

Informazioni Fondamentali

  • ID Articolo: 2409.08607
  • Titolo: Strategy Templates for Almost-Sure and Positive Winning of Stochastic Parity Games towards Permissive and Resilient Control
  • Autori: Kittiphon Phalakarn, Sasinee Pruekprasert, Ichiro Hasuo
  • Classificazione: eess.SY cs.LO cs.SY
  • Data di Pubblicazione: Settembre 2024 (arXiv v2: 16 ottobre 2025)
  • Link Articolo: https://arxiv.org/abs/2409.08607

Riassunto

I giochi stocastici svolgono un ruolo fondamentale in numerose applicazioni, in particolare nel controllo dei sistemi cibernetici-fisici (CPS), dove il controllore e l'ambiente sono modellati come partecipanti al gioco. Gli algoritmi tradizionali mirano tipicamente a determinare una singola strategia vincente per sviluppare il controllore. Tuttavia, nel controllo dei CPS e in altri ambiti, i controllori permissivi sono cruciali poiché consentono al sistema di adattarsi quando emergono vincoli aggiuntivi e di mantenere resilienza rispetto ai cambiamenti durante l'esecuzione. Questo lavoro generalizza il concetto di modelli di strategia dai giochi deterministici ai giochi stocastici, dove tali modelli sono in grado di catturare un numero infinito di strategie vincenti, permettendo un adattamento efficiente della strategia ai cambiamenti del sistema. Ci concentriamo su due criteri di vittoria (vittoria quasi-certa e vittoria a probabilità positiva) e cinque obiettivi di vittoria (sicurezza, raggiungibilità, Büchi, co-Büchi e parità).

Contesto di Ricerca e Motivazione

Contesto del Problema

  1. Limitazioni degli Approcci Tradizionali: Gli algoritmi tradizionali di risoluzione dei giochi ricercano tipicamente una singola strategia vincente, senza considerare la permissività (permissiveness) della strategia
  2. Esigenze delle Applicazioni Pratiche: Nel controllo dei sistemi cibernetici-fisici, sono necessari controllori permissivi per adattarsi a vincoli aggiuntivi e a cambiamenti durante l'esecuzione
  3. Esigenze di Controllo Resiliente: I sistemi devono mantenere robustezza quando affrontano guasti o cambiamenti ambientali

Motivazione della Ricerca

  • Il concetto esistente di modelli di strategia si applica solo ai giochi deterministici, mancando di supporto per i giochi stocastici
  • È necessario un framework che possa catturare un numero infinito di strategie vincenti per supportare l'adattamento rapido della strategia
  • Nelle applicazioni pratiche come il controllo dei CPS, la permissività e la resilienza sono requisiti chiave

Contributi Principali

  1. Algoritmo di Modello di Strategia Quasi-Certa: Propone algoritmi di costruzione di modelli di strategia quasi-certa per cinque obiettivi di vittoria (sicurezza, raggiungibilità, Büchi, co-Büchi, parità)
  2. Modelli di Strategia a Probabilità Positiva: Sviluppa algoritmi di costruzione e composizione di modelli di strategia secondo il criterio di vittoria a probabilità positiva
  3. Framework di Confronto dei Modelli: Fornisce discussioni comparative dei modelli basate su permissività e dimensione
  4. Metodo di Estrazione della Strategia: Propone un nuovo metodo per estrarre strategie vincenti da un dato modello, bilanciando l'obiettivo di vittoria e la permissività

Dettagli Metodologici

Definizione del Compito

Definizione di Gioco Stocastico: G = (V, E, (V□, V○, V△)), dove:

  • V è l'insieme dei vertici, E è l'insieme degli archi
  • V□, V○, V△ rappresentano rispettivamente i vertici del giocatore Even, del giocatore Odd e del giocatore Random
  • Denominato gioco "2.5" giocatori, contenente due giocatori principali e un giocatore casuale

Definizione di Modello di Strategia: T = (P, L, C), dove:

  • P ⊆ E□ è l'insieme degli archi disabilitati
  • L ⊆ 2^E□ è l'insieme dei gruppi attivi
  • C ⊆ E□ è l'insieme degli archi co-attivi

Architettura del Modello

1. Costruzione di Modelli di Strategia Quasi-Certa

Obiettivo di Sicurezza (G X):

SafetyTemplate(G, X):
1. W□ ← νY.(X ∩ (Pre□(Y) ∪ Pre(Y)))
2. P ← Edges□(W□, V \ W□)
3. return (P, ∅, ∅)

Obiettivo di Raggiungibilità (F X):

ReachabilityTemplate(G, X):
1. A ← Attr'(X)
2. W□ ← Attr'□(A)
3. P ← Edges□(W□, V \ W□)
4. C ← Edges□(W□ \ A, W□ \ A)
5. return (P, ∅, C)

Obiettivo di Büchi (GF X): Costruisce gruppi attivi attraverso la funzione LiveGroups, garantendo che i percorsi visitino l'insieme obiettivo infinite volte.

Obiettivo di Parità:

  1. Riduce il gioco stocastico a un gioco deterministico (utilizzando l'algoritmo Reduce)
  2. Costruisce il modello di strategia del gioco deterministico
  3. Trasforma il modello nel gioco stocastico

2. Costruzione di Modelli di Strategia a Probabilità Positiva

PositiveTemplate(G, φ):
1. Calcola W□, W○ e il modello quasi-certo T^(a)
2. W? ← V \ (W□ ∪ W○)
3. P^(p) ← P^(a) ∪ Edges□(W?, W○)
4. C^(p) ← C^(a) ∪ Edges□(W?, W?)
5. return T^(p) = (P^(p), L^(p), C^(p))

Punti di Innovazione Tecnica

  1. Estensione delle Operazioni di Insieme: Introduce nuovi operatori di insieme che considerano il giocatore Random, come Pre△(X', X) e Attr'□(X)
  2. Algoritmo di Composizione dei Modelli: Propone un meccanismo di rilevamento dei conflitti che ricalcola quando i modelli sono in conflitto
  3. Estrazione Parametrizzata della Strategia: Utilizza parametri α e β per bilanciare la permissività e la velocità di raggiungimento dell'obiettivo
  4. Estensione della Vittoria a Probabilità Positiva: Estende per la prima volta i modelli di strategia al criterio di vittoria a probabilità positiva

Configurazione Sperimentale

Verifica Teorica

L'articolo verifica principalmente la correttezza degli algoritmi attraverso prove teoriche, incluse:

  • Teoremi di correttezza per i vari algoritmi di costruzione dei modelli
  • Teoremi di permissività per i metodi di estrazione della strategia
  • Prove di correttezza per gli algoritmi di composizione dei modelli

Analisi della Complessità

  • Il tempo di esecuzione nel caso peggiore degli algoritmi di costruzione della strategia corrisponde agli algoritmi standard
  • La composizione dei modelli e l'estrazione della strategia possono essere eseguite efficientemente durante l'esecuzione

Risultati Sperimentali

Risultati Teorici

Teoremi 10-14: Provano la correttezza degli algoritmi di costruzione dei modelli di strategia per i vari obiettivi di vittoria

  • SafetyTemplate costruisce modelli quasi-certamente vincenti per G X
  • ReachabilityTemplate costruisce modelli quasi-certamente vincenti per F X
  • Analogamente applicabile ad altri obiettivi

Teorema 18: Il modello costruito da PositiveTemplate è sia quasi-certamente vincente che vincente a probabilità positiva

Teorema 27: Il metodo di estrazione parametrizzato è più permissivo del metodo Extract originale

Analisi della Permissività

Proposizione 22: Se P ⊇ P', L ⊇ L', C ⊇ C', allora T non è più permissivo di T'

Proposizione 23: Se T non è più permissivo di T' e T' è vincente, allora anche T è vincente

Potenziale di Applicazione Pratica

L'articolo indica che, sulla base dei risultati sperimentali dei giochi deterministici, i modelli di strategia possono realizzare un'accelerazione di almeno 2 volte nella sintesi incrementale e ridurre efficacemente il ricalcolo nel controllo tollerante ai guasti anche quando il 30% delle scelte è disabilitato.

Lavori Correlati

Teoria Classica della Permissività

  • Ramadge e Wonham (1987) hanno formalmente introdotto il concetto di permissività nel controllo supervisivo
  • Bernet et al. hanno provato l'esistenza di strategie massimamente permissive nei giochi di parità

Sviluppo dei Modelli di Strategia

  • Anand et al. hanno introdotto i modelli di strategia per i giochi deterministici in TACAS e CAV 2023
  • Questo lavoro è il primo a estendere i modelli di strategia ai giochi stocastici

Risoluzione di Giochi Stocastici

  • Metodo di riduzione dei giochi di parità stocastici di Chatterjee et al.
  • Operatori di insieme per giochi stocastici di Banerjee et al.

Conclusioni e Discussione

Conclusioni Principali

  1. Estende con successo il concetto di modelli di strategia dai giochi deterministici ai giochi stocastici
  2. Fornisce un framework algoritmico completo che copre due criteri di vittoria e cinque obiettivi di vittoria
  3. Il nuovo metodo di estrazione della strategia aumenta la permissività mantenendo la correttezza

Limitazioni

  1. Le strategie a probabilità positiva non garantiscono l'ottimalità della probabilità
  2. L'implementazione dell'algoritmo e la verifica sperimentale rimangono da completare
  3. Considera solo giochi a stati finiti

Direzioni Future

  1. Costruire modelli che mantengono la stessa permissività ma con dimensione minore
  2. Estendere a obiettivi definiti da formule di logica temporale metrica (MTL)
  3. Applicazione a sistemi in tempo reale

Valutazione Approfondita

Punti di Forza

  1. Contributo Teorico Significativo: Estende per la prima volta i modelli di strategia ai giochi stocastici con un framework teorico completo
  2. Progettazione Algoritmica Razionale: Utilizza abilmente le operazioni di insieme e le tecniche di riduzione esistenti
  3. Prospettive di Applicazione Ampie: Ha importanza pratica significativa per il controllo dei sistemi cibernetici-fisici
  4. Rigore Matematico: Fornisce prove di correttezza complete

Carenze

  1. Mancanza di Verifica Sperimentale: Principalmente lavoro teorico, mancanza di implementazione pratica e valutazione delle prestazioni
  2. Problema di Ottimalità: Le strategie a probabilità positiva non garantiscono l'ottimalità
  3. Analisi della Complessità Insufficiente: L'analisi della complessità computazionale pratica è piuttosto sommaria

Impatto

  1. Valore Accademico: Fornisce nuovi strumenti e metodi per la teoria dei giochi stocastici
  2. Valore Pratico: Fornisce fondamenti teorici per la progettazione di controllori permissivi
  3. Scalabilità: Fornisce un buon framework di base per ricerche successive

Scenari Applicabili

  1. Controllo robusto dei sistemi cibernetici-fisici
  2. Sistemi di automazione che richiedono adattabilità
  3. Progettazione di sistemi di controllo multi-obiettivo
  4. Sistemi di controllo tolleranti ai guasti

Riferimenti Bibliografici

L'articolo cita 35 riferimenti correlati, principalmente coprenti:

  • Letteratura fondamentale sulla teoria dei giochi
  • Teoria del controllo supervisivo
  • Lavori correlati ai modelli di strategia
  • Algoritmi di risoluzione di giochi stocastici
  • Logica temporale lineare e model checking

Valutazione Complessiva: Questo è un articolo di ricerca teorica di alta qualità che estende con successo il concetto di modelli di strategia dai giochi deterministici ai giochi stocastici, fornendo fondamenti teorici importanti per il controllo permissivo e resiliente. Sebbene manchi di verifica sperimentale, il contributo teorico è significativo e ha un importante effetto propulsivo sul settore correlato.