Strategy Templates for Almost-Sure and Positive Winning of Stochastic Parity Games towards Permissive and Resilient Control
Phalakarn, Pruekprasert, Hasuo
Stochastic games are fundamental in various applications, including the control of cyber-physical systems (CPS), where both controller and environment are modeled as players. Traditional algorithms typically aim to determine a single winning strategy to develop a controller. However, in CPS control and other domains, permissive controllers are essential, as they enable the system to adapt when additional constraints arise and remain resilient to runtime changes. This work generalizes the concept of (permissive winning) strategy templates, originally introduced by Anand et al. at TACAS and CAV 2023 for deterministic games, to incorporate stochastic games. These templates capture an infinite number of winning strategies, allowing for efficient strategy adaptation to system changes. We focus on two winning criteria (almost-sure and positive winning) and five winning objectives (safety, reachability, Büchi, co-Büchi, and parity). Our contributions include algorithms for constructing templates for each winning criterion and objective and a novel approach for extracting a winning strategy from a given template. Discussions on comparisons between templates and between strategy extraction methods are provided.
academic
स्टोकेस्टिक पैरिटी गेम्स के लिए लगभग-निश्चित और सकारात्मक जीत की रणनीति टेम्पलेट: अनुमतिशील और लचीले नियंत्रण की ओर
स्टोकेस्टिक गेम्स विभिन्न अनुप्रयोगों में मौलिक भूमिका निभाते हैं, विशेष रूप से साइबर-फिजिकल सिस्टम (CPS) नियंत्रण में, जहां नियंत्रक और पर्यावरण को गेम प्रतिभागियों के रूप में मॉडल किया जाता है। पारंपरिक एल्गोरिदम आमतौर पर नियंत्रक विकसित करने के लिए एकल जीत रणनीति निर्धारित करने का लक्ष्य रखते हैं। हालांकि, CPS नियंत्रण और अन्य क्षेत्रों में, अनुमतिशील नियंत्रक महत्वपूर्ण हैं क्योंकि वे अतिरिक्त बाधाओं के उद्भव पर सिस्टम को अनुकूलित कर सकते हैं और रनटाइम परिवर्तनों के प्रति लचीले रहते हैं। यह कार्य रणनीति टेम्पलेट की अवधारणा को नियतात्मक गेम्स से स्टोकेस्टिक गेम्स तक सामान्यीकृत करता है, जो अनंत संख्या में जीत रणनीतियों को पकड़ सकते हैं, जिससे सिस्टम परिवर्तनों के लिए कुशल रणनीति अनुकूलन की अनुमति मिलती है। हम दो जीत मानदंड (लगभग निश्चित जीत और सकारात्मक संभावना जीत) और पांच जीत उद्देश्यों (सुरक्षा, पहुंच, Büchi, co-Büchi और समता) पर ध्यान केंद्रित करते हैं।
पारंपरिक विधि की सीमाएं: पारंपरिक गेम समाधान एल्गोरिदम आमतौर पर केवल एकल जीत रणनीति खोजते हैं, रणनीति की अनुमतिशीलता (permissiveness) पर विचार नहीं करते
व्यावहारिक अनुप्रयोग की आवश्यकता: साइबर-फिजिकल सिस्टम नियंत्रण में, अतिरिक्त बाधाओं को अनुकूलित करने और रनटाइम परिवर्तनों को संभालने के लिए अनुमतिशील नियंत्रकों की आवश्यकता होती है
लचीले नियंत्रण की आवश्यकता: सिस्टम को विफलताओं या पर्यावरणीय परिवर्तनों का सामना करते समय मजबूत रहने की आवश्यकता है
लगभग निश्चित जीत रणनीति टेम्पलेट एल्गोरिदम: पांच जीत उद्देश्यों (सुरक्षा, पहुंच, Büchi, co-Büchi, समता) के लिए लगभग निश्चित जीत रणनीति टेम्पलेट निर्माण एल्गोरिदम प्रस्तावित किए
सकारात्मक संभावना जीत रणनीति टेम्पलेट: सकारात्मक संभावना जीत मानदंड के तहत रणनीति टेम्पलेट निर्माण और संयोजन एल्गोरिदम विकसित किए
रणनीति टेम्पलेट तुलना ढांचा: अनुमतिशीलता और आकार के आधार पर टेम्पलेट तुलना के लिए चर्चा प्रदान की
रणनीति निष्कर्षण विधि: दिए गए टेम्पलेट से जीत रणनीति निकालने के लिए नई विधि प्रस्तावित की, जो जीत उद्देश्य और अनुमतिशीलता को संतुलित करती है
पेपर इंगित करता है कि नियतात्मक गेम्स के आधार पर प्रायोगिक परिणामों के अनुसार, रणनीति टेम्पलेट वृद्धिशील संश्लेषण में कम से कम 2 गुना त्वरण प्राप्त कर सकते हैं, और सहनशील नियंत्रण में यहां तक कि 30% विकल्पों के निषिद्ध होने पर भी पुनः गणना को प्रभावी ढंग से कम कर सकते हैं।
पेपर 35 संबंधित संदर्भों का हवाला देता है, मुख्य रूप से शामिल हैं:
गेम सिद्धांत मूल साहित्य
पर्यवेक्षी नियंत्रण सिद्धांत
रणनीति टेम्पलेट संबंधित कार्य
स्टोकेस्टिक गेम्स समाधान एल्गोरिदम
रैखिक समय तर्क और मॉडल जांच
समग्र मूल्यांकन: यह एक उच्च गुणवत्ता वाला सैद्धांतिक अनुसंधान पेपर है, जो रणनीति टेम्पलेट अवधारणा को नियतात्मक गेम्स से स्टोकेस्टिक गेम्स तक सफलतापूर्वक विस्तारित करता है, अनुमतिशील और लचीले नियंत्रण के लिए महत्वपूर्ण सैद्धांतिक आधार प्रदान करता है। हालांकि प्रायोगिक सत्यापन की कमी है, लेकिन सैद्धांतिक योगदान महत्वपूर्ण है और संबंधित क्षेत्र में महत्वपूर्ण प्रेरणा प्रदान करता है।