Strategy Templates for Almost-Sure and Positive Winning of Stochastic Parity Games towards Permissive and Resilient Control
Phalakarn, Pruekprasert, Hasuo
Stochastic games are fundamental in various applications, including the control of cyber-physical systems (CPS), where both controller and environment are modeled as players. Traditional algorithms typically aim to determine a single winning strategy to develop a controller. However, in CPS control and other domains, permissive controllers are essential, as they enable the system to adapt when additional constraints arise and remain resilient to runtime changes. This work generalizes the concept of (permissive winning) strategy templates, originally introduced by Anand et al. at TACAS and CAV 2023 for deterministic games, to incorporate stochastic games. These templates capture an infinite number of winning strategies, allowing for efficient strategy adaptation to system changes. We focus on two winning criteria (almost-sure and positive winning) and five winning objectives (safety, reachability, Büchi, co-Büchi, and parity). Our contributions include algorithms for constructing templates for each winning criterion and objective and a novel approach for extracting a winning strategy from a given template. Discussions on comparisons between templates and between strategy extraction methods are provided.
academic
확률적 패리티 게임의 거의 확실한 승리 및 양의 확률 승리를 위한 전략 템플릿: 허용적이고 탄력적인 제어를 향하여
확률적 게임은 다양한 응용 분야에서 기초적인 역할을 하며, 특히 사이버-물리 시스템(CPS) 제어에서 제어기와 환경이 게임 참여자로 모델링된다. 전통적인 알고리즘은 일반적으로 제어기를 개발하기 위한 단일 승리 전략을 결정하는 것을 목표로 한다. 그러나 CPS 제어 및 기타 분야에서는 추가 제약 조건이 발생할 때 시스템이 적응하고 런타임 변화에 대해 탄력성을 유지할 수 있도록 하는 허용적 제어기가 중요하다. 본 연구는 전략 템플릿 개념을 확정적 게임에서 확률적 게임으로 일반화하며, 이러한 템플릿은 무한한 수의 승리 전략을 포착하여 시스템 변화에 대한 효율적인 전략 적응을 가능하게 한다. 우리는 두 가지 승리 기준(거의 확실한 승리 및 양의 확률 승리)과 다섯 가지 승리 목표(안전성, 도달성, Büchi, co-Büchi 및 패리티)에 중점을 둔다.