Strategy Templates for Almost-Sure and Positive Winning of Stochastic Parity Games towards Permissive and Resilient Control
Phalakarn, Pruekprasert, Hasuo
Stochastic games are fundamental in various applications, including the control of cyber-physical systems (CPS), where both controller and environment are modeled as players. Traditional algorithms typically aim to determine a single winning strategy to develop a controller. However, in CPS control and other domains, permissive controllers are essential, as they enable the system to adapt when additional constraints arise and remain resilient to runtime changes. This work generalizes the concept of (permissive winning) strategy templates, originally introduced by Anand et al. at TACAS and CAV 2023 for deterministic games, to incorporate stochastic games. These templates capture an infinite number of winning strategies, allowing for efficient strategy adaptation to system changes. We focus on two winning criteria (almost-sure and positive winning) and five winning objectives (safety, reachability, Büchi, co-Büchi, and parity). Our contributions include algorithms for constructing templates for each winning criterion and objective and a novel approach for extracting a winning strategy from a given template. Discussions on comparisons between templates and between strategy extraction methods are provided.
academic
Strategievorlagen für Fast-Sichere und Positive Gewinne in Stochastischen Paritätsspielen für Permissive und Resiliente Kontrolle
Stochastische Spiele spielen eine grundlegende Rolle in verschiedenen Anwendungen, insbesondere in der Kontrolle von Cyber-Physischen Systemen (CPS), wo der Regler und die Umgebung als Spielteilnehmer modelliert werden. Herkömmliche Algorithmen zielen typischerweise darauf ab, eine einzelne Gewinnstrategie zur Entwicklung des Reglers zu bestimmen. In der CPS-Kontrolle und anderen Bereichen sind jedoch permissive Regler von entscheidender Bedeutung, da sie sich an das System anpassen können, wenn zusätzliche Einschränkungen auftreten, und gegenüber Laufzeitänderungen resilient bleiben. Diese Arbeit verallgemeinert das Konzept der Strategievorlagen von deterministischen Spielen auf stochastische Spiele. Diese Vorlagen können unendlich viele Gewinnstrategien erfassen und ermöglichen eine effiziente Strategieanpassung an Systemänderungen. Wir konzentrieren uns auf zwei Gewinnkriterien (fast-sichere Gewinne und positive Wahrscheinlichkeitsgewinne) sowie fünf Gewinnziele (Sicherheit, Erreichbarkeit, Büchi, Co-Büchi und Parität).
Einschränkungen herkömmlicher Methoden: Herkömmliche Spielauflösungsalgorithmen suchen typischerweise nur nach einer einzelnen Gewinnstrategie, ohne die Permissivität der Strategie zu berücksichtigen
Anforderungen praktischer Anwendungen: In der Kontrolle von Cyber-Physischen Systemen werden permissive Regler benötigt, um sich an zusätzliche Einschränkungen und Laufzeitänderungen anzupassen
Anforderungen an resiliente Kontrolle: Systeme müssen robust bleiben, wenn sie mit Ausfällen oder Umgebungsänderungen konfrontiert werden
Algorithmen für fast-sichere Gewinnstrategievorlagen: Präsentation von Konstruktionsalgorithmen für fast-sichere Gewinnstrategievorlagen für fünf Gewinnziele (Sicherheit, Erreichbarkeit, Büchi, Co-Büchi, Parität)
Strategievorlagen für positive Wahrscheinlichkeitsgewinne: Entwicklung von Konstruktions- und Kombinationsalgorithmen für Strategievorlagen unter dem Kriterium der positiven Wahrscheinlichkeitsgewinne
Vergleichsframework für Strategievorlagen: Bereitstellung einer Diskussion zum Vergleich von Vorlagen basierend auf Permissivität und Größe
Strategieextraktionsmethoden: Vorschlag neuer Methoden zur Extraktion von Gewinnstrategien aus gegebenen Vorlagen, die Gewinnziele und Permissivität ausbalancieren
Erweiterung von Mengenoperationen: Einführung neuer Mengenoperatoren, die den Random-Spieler berücksichtigen, wie Pre△(X', X) und Attr'□(X)
Vorlagenkombinationsalgorithmen: Vorschlag eines Konflikterkennungsmechanismus, der bei Vorlagenkonflikten eine Neuberechnung durchführt
Parametrisierte Strategieextraktion: Verwendung von Parametern α und β zur Ausbalancierung von Permissivität und Geschwindigkeit der Zielerfüllung
Erweiterung auf positive Wahrscheinlichkeitsgewinne: Erste Erweiterung von Strategievorlagen auf das Kriterium der positiven Wahrscheinlichkeitsgewinne
Das Paper weist darauf hin, dass Strategievorlagen basierend auf Ergebnissen deterministischer Spiele in der inkrementellen Synthese mindestens eine 2-fache Beschleunigung erreichen können und in der fehlertoleranten Kontrolle auch dann effektiv Neuberechnungen reduzieren können, wenn 30% der Auswahlmöglichkeiten deaktiviert sind.
Das Paper zitiert 35 relevante Arbeiten, die hauptsächlich folgende Bereiche abdecken:
Grundlegende Literatur zur Spieltheorie
Theorie der Überwachungskontrolle
Arbeiten zu Strategievorlagen
Algorithmen zur Lösung stochastischer Spiele
Lineare Zeitlogik und Modellprüfung
Gesamtbewertung: Dies ist ein hochqualitatives theoretisches Forschungspapier, das das Konzept der Strategievorlagen erfolgreich von deterministischen auf stochastische Spiele erweitert und eine wichtige theoretische Grundlage für permissive und resiliente Kontrolle bietet. Obwohl experimentelle Verifikation fehlt, sind die theoretischen Beiträge bedeutend und haben wichtige Auswirkungen auf verwandte Bereiche.