Strategy Templates for Almost-Sure and Positive Winning of Stochastic Parity Games towards Permissive and Resilient Control
Phalakarn, Pruekprasert, Hasuo
Stochastic games are fundamental in various applications, including the control of cyber-physical systems (CPS), where both controller and environment are modeled as players. Traditional algorithms typically aim to determine a single winning strategy to develop a controller. However, in CPS control and other domains, permissive controllers are essential, as they enable the system to adapt when additional constraints arise and remain resilient to runtime changes. This work generalizes the concept of (permissive winning) strategy templates, originally introduced by Anand et al. at TACAS and CAV 2023 for deterministic games, to incorporate stochastic games. These templates capture an infinite number of winning strategies, allowing for efficient strategy adaptation to system changes. We focus on two winning criteria (almost-sure and positive winning) and five winning objectives (safety, reachability, Büchi, co-Büchi, and parity). Our contributions include algorithms for constructing templates for each winning criterion and objective and a novel approach for extracting a winning strategy from a given template. Discussions on comparisons between templates and between strategy extraction methods are provided.
academic
Modèles de Stratégie pour la Victoire Presque-Sûre et Positive dans les Jeux de Parité Stochastiques vers un Contrôle Permissif et Résilient
Les jeux stochastiques jouent un rôle fondamental dans diverses applications, en particulier dans le contrôle des systèmes cyber-physiques (CPS), où le contrôleur et l'environnement sont modélisés comme des participants au jeu. Les algorithmes traditionnels visent généralement à déterminer une stratégie gagnante unique pour développer le contrôleur. Cependant, dans le contrôle des CPS et autres domaines, les contrôleurs permissifs sont essentiels car ils permettent au système de s'adapter en cas de contraintes supplémentaires et de rester résilients aux changements d'exécution. Ce travail généralise le concept de modèles de stratégie des jeux déterministes aux jeux stochastiques. Ces modèles peuvent capturer un nombre infini de stratégies gagnantes, permettant une adaptation efficace des stratégies aux changements du système. Nous nous concentrons sur deux critères de victoire (victoire presque-sûre et victoire à probabilité positive) et cinq objectifs gagnants (sécurité, accessibilité, Büchi, co-Büchi et parité).
Limitations des approches traditionnelles: Les algorithmes classiques de résolution de jeux recherchent généralement une seule stratégie gagnante, sans tenir compte de la permissivité des stratégies
Besoins des applications pratiques: Dans le contrôle des systèmes cyber-physiques, des contrôleurs permissifs sont nécessaires pour s'adapter à des contraintes supplémentaires et aux changements d'exécution
Exigences de contrôle résilient: Les systèmes doivent maintenir leur robustesse face aux défaillances ou aux changements environnementaux
Algorithme de modèle de stratégie presque-sûre: Présentation d'algorithmes de construction de modèles de stratégie presque-sûre pour cinq objectifs gagnants (sécurité, accessibilité, Büchi, co-Büchi, parité)
Modèles de stratégie à probabilité positive: Développement d'algorithmes de construction et de composition de modèles de stratégie selon le critère de victoire à probabilité positive
Cadre de comparaison des modèles de stratégie: Fourniture d'une discussion comparative des modèles basée sur la permissivité et la taille
Méthode d'extraction de stratégie: Proposition d'une nouvelle méthode d'extraction de stratégies gagnantes à partir d'un modèle donné, équilibrant l'objectif gagnant et la permissivité
ReachabilityTemplate(G, X):
1. A ← Attr'(X)
2. W□ ← Attr'□(A)
3. P ← Edges□(W□, V \ W□)
4. C ← Edges□(W□ \ A, W□ \ A)
5. return (P, ∅, C)
Objectif Büchi (GF X):
Construction de groupes actifs via la fonction LiveGroups, garantissant que les chemins visitent infiniment souvent l'ensemble cible.
Objectif de parité:
Réduction du jeu stochastique en jeu déterministe (utilisant l'algorithme Reduce)
Construction du modèle de stratégie du jeu déterministe
Conversion du modèle en modèle de jeu stochastique
Extension des opérations ensemblistes: Introduction de nouveaux opérateurs ensemblistes tenant compte du joueur Random, tels que Pre△(X', X) et Attr'□(X)
Algorithme de composition de modèles: Proposition d'un mécanisme de détection de conflits, recalculant lorsque les modèles entrent en conflit
Extraction de stratégie paramétrée: Utilisation de paramètres α et β pour équilibrer la permissivité et la vitesse d'atteinte de l'objectif
Extension à probabilité positive: Première extension des modèles de stratégie au critère de victoire à probabilité positive
L'article indique que, sur la base des résultats expérimentaux des jeux déterministes, les modèles de stratégie peuvent réaliser une accélération d'au moins 2 fois dans la synthèse incrémentale et réduire efficacement les recalculs même lorsque 30% des choix sont interdits dans le contrôle tolérant aux pannes.
Logique temporelle linéaire et vérification de modèles
Évaluation Globale: Ceci est un article de recherche théorique de haute qualité qui étend avec succès le concept de modèles de stratégie des jeux déterministes aux jeux stochastiques, fournissant une base théorique importante pour le contrôle permissif et résilient. Bien que manquant de vérification expérimentale, la contribution théorique est significative et exerce un impact important sur les domaines connexes.