Strategy Templates for Almost-Sure and Positive Winning of Stochastic Parity Games towards Permissive and Resilient Control
Phalakarn, Pruekprasert, Hasuo
Stochastic games are fundamental in various applications, including the control of cyber-physical systems (CPS), where both controller and environment are modeled as players. Traditional algorithms typically aim to determine a single winning strategy to develop a controller. However, in CPS control and other domains, permissive controllers are essential, as they enable the system to adapt when additional constraints arise and remain resilient to runtime changes. This work generalizes the concept of (permissive winning) strategy templates, originally introduced by Anand et al. at TACAS and CAV 2023 for deterministic games, to incorporate stochastic games. These templates capture an infinite number of winning strategies, allowing for efficient strategy adaptation to system changes. We focus on two winning criteria (almost-sure and positive winning) and five winning objectives (safety, reachability, Büchi, co-Büchi, and parity). Our contributions include algorithms for constructing templates for each winning criterion and objective and a novel approach for extracting a winning strategy from a given template. Discussions on comparisons between templates and between strategy extraction methods are provided.
academic
Шаблоны стратегий для почти достоверного и положительного выигрыша в стохастических играх четности в направлении разрешающего и устойчивого управления
Стохастические игры играют фундаментальную роль в различных приложениях, особенно в управлении киберфизическими системами (КФС), где контроллер и окружение моделируются как участники игры. Традиционные алгоритмы обычно направлены на определение единственной выигрышной стратегии для разработки контроллера. Однако в управлении КФС и других областях разрешающие контроллеры имеют критическое значение, поскольку они способны адаптироваться к системе при возникновении дополнительных ограничений и сохранять устойчивость к изменениям во время выполнения. В данной работе концепция шаблонов стратегий обобщается с детерминированных игр на стохастические игры, причем эти шаблоны способны захватывать бесконечное количество выигрышных стратегий, позволяя эффективно адаптировать стратегии к изменениям системы. Мы сосредоточиваемся на двух критериях выигрыша (почти достоверный выигрыш и положительный выигрыш) и пяти целях выигрыша (безопасность, достижимость, Бюхи, ко-Бюхи и четность).
Ограничения традиционных методов: Традиционные алгоритмы решения игр обычно ищут только единственную выигрышную стратегию, не учитывая разрешающий характер стратегии (permissiveness)
Требования практических приложений: В управлении киберфизическими системами требуются разрешающие контроллеры для адаптации к дополнительным ограничениям и изменениям во время выполнения
Требования к устойчивому управлению: Системы должны сохранять робастность при столкновении с отказами или изменениями окружения
Алгоритм шаблонов стратегий почти достоверного выигрыша: Предложены алгоритмы построения шаблонов стратегий почти достоверного выигрыша для пяти целей выигрыша (безопасность, достижимость, Бюхи, ко-Бюхи, четность)
Шаблоны стратегий положительного выигрыша: Разработаны алгоритмы построения и композиции шаблонов стратегий при критерии положительного выигрыша
Структура сравнения шаблонов стратегий: Предоставлено обсуждение сравнения шаблонов на основе разрешающего характера и размера
Методы извлечения стратегий: Предложены новые методы извлечения выигрышных стратегий из заданного шаблона, балансирующие цель выигрыша и разрешающий характер
Статья указывает, что на основе результатов для детерминированных игр шаблоны стратегий могут достичь ускорения как минимум в 2 раза при инкрементальном синтезе и эффективно снизить пересчеты при отказоустойчивом управлении даже при запрещении 30% выборов.
Статья цитирует 35 связанных источников, охватывающих в основном:
Фундаментальную литературу по теории игр
Теорию надзорного управления
Работы, связанные с шаблонами стратегий
Алгоритмы решения стохастических игр
Линейную временную логику и проверку моделей
Общая оценка: Это высококачественная теоретическая исследовательская работа, успешно расширяющая концепцию шаблонов стратегий с детерминированных игр на стохастические игры, обеспечивающая важную теоретическую основу для разрешающего и устойчивого управления. Хотя отсутствует экспериментальная верификация, теоретический вклад значителен и оказывает важное стимулирующее воздействие на соответствующие области.