Natural Strategic Ability in Stochastic Multi-Agent Systems
Berthon, Katoen, Mittelmann et al.
Strategies synthesized using formal methods can be complex and often require infinite memory, which does not correspond to the expected behavior when trying to model Multi-Agent Systems (MAS). To capture such behaviors, natural strategies are a recently proposed framework striking a balance between the ability of agents to strategize with memory and the model-checking complexity, but until now has been restricted to fully deterministic settings. For the first time, we consider the probabilistic temporal logics PATL and PATL* under natural strategies (NatPATL and NatPATL*, resp.). As main result we show that, in stochastic MAS, NatPATL model-checking is NP-complete when the active coalition is restricted to deterministic strategies. We also give a 2NEXPTIME complexity result for NatPATL* with the same restriction. In the unrestricted case, we give an EXPSPACE complexity for NatPATL and 3EXPSPACE complexity for NatPATL*.
academic
स्टोकेस्टिक मल्टी-एजेंट सिस्टम में प्राकृतिक रणनीतिक क्षमता
यह पेपर पहली बार प्राकृतिक रणनीतियों (natural strategies) की रूपरेखा को स्टोकेस्टिक मल्टी-एजेंट सिस्टम (stochastic MAS) तक विस्तारित करता है, और संभाव्य वैकल्पिक समय तर्क PATL और PATL* के प्राकृतिक रणनीति संस्करण (NatPATL और NatPATL*) प्रस्तावित करता है। मुख्य परिणाम दर्शाते हैं: जब गठबंधन निर्धारक रणनीतियों तक सीमित होते हैं, तो NatPATL मॉडल जांच ∆P₂-पूर्ण है; NatPATL* 2NEXPTIME जटिलता है। अप्रतिबंधित स्थिति में (संभाव्य रणनीतियां), NatPATL जटिलता EXPSPACE है, NatPATL* 3EXPSPACE है। यह कार्य सीमित स्मृति एजेंटों की रणनीतिक क्षमता सत्यापन और कम्प्यूटेशनल जटिलता के बीच एक अच्छा संतुलन प्राप्त करता है।
औपचारिक विधियों द्वारा संश्लेषित रणनीतियां आमतौर पर उच्च जटिलता की होती हैं और अनंत स्मृति की आवश्यकता होती है, जो वास्तविक मल्टी-एजेंट सिस्टम मॉडलिंग में अव्यावहारिक है। मानव एजेंट और कम्प्यूटेशनल संसाधनों से सीमित कृत्रिम एजेंट इस तरह की जटिल रणनीतियों को निष्पादित नहीं कर सकते।
सैद्धांतिक विस्तार: पहली बार प्राकृतिक रणनीति रूपरेखा को निर्धारक वातावरण से स्टोकेस्टिक मल्टी-एजेंट सिस्टम तक विस्तारित करना, व्यवहारिक प्राकृतिक रणनीतियों (behavioral natural strategies) को परिभाषित करना
नई तर्क प्रणाली: NatPATL और NatPATL* दो तर्क प्रणालियां प्रस्तावित करना, स्मृतिहीन (memoryless, r) और बंधी हुई स्मृति (bounded recall, R) दोनों शब्दार्थ का समर्थन करना
जटिलता परिणाम (तालिका 1 देखें):
निर्धारक रणनीति: NatPATLr/R ∆P₂-पूर्ण है (NP-hard निचली सीमा), NatPATL*r/R 2NEXPTIME है
संभाव्य रणनीति: NatPATLr/R EXPSPACE है, NatPATL*r/R 3EXPSPACE है
अभिव्यक्ति शक्ति विश्लेषण: NatPATL() और PATL() की तुलनीय विभेदन शक्ति और अभिव्यक्ति शक्ति को साबित करना
अनुप्रयोग उदाहरण: इलेक्ट्रॉनिक मतदान प्रणाली और द्वार पहुंच नियंत्रण प्रणाली के माध्यम से व्यावहारिक अनुप्रयोग मूल्य प्रदर्शित करना
मॉडल जांच समस्या: दिए गए स्टोकेस्टिक समवर्ती गेम संरचना (CGS) G, स्थिति s और NatPATL(*) सूत्र φ को देखते हुए, यह निर्धारित करना कि G, s ⊨ρ φ सत्य है या नहीं (ρ∈{r,R} स्मृतिहीन या बंधी हुई स्मृति को दर्शाता है)।
इनपुट:
CGS G = (St, L, δ, ℓ): स्थिति समुच्चय, वैधता फ़ंक्शन, स्टोकेस्टिक संक्रमण फ़ंक्शन, लेबलिंग फ़ंक्शन
प्रारंभिक स्थिति s ∈ St
NatPATL(*) सूत्र φ, जटिलता सीमा k सहित
आउटपुट: बूलियन मान जो दर्शाता है कि सूत्र संतुष्ट है या नहीं
दिए गए इतिहास h को देखते हुए, रणनीति पहली संतुष्ट शर्त को चुनती है:
match(h, σₐ) = min{i : h condᵢ(σₐ) के साथ सुसंगत है और actᵢ(σₐ) last(h) में वैध है}
इतिहास h नियमित अभिव्यक्ति r के साथ सुसंगत है यदि और केवल यदि कोई शब्द b∈L(r) मौजूद है जैसे कि h की प्रत्येक स्थिति b में संबंधित बूलियन सूत्र को संतुष्ट करती है।
संभाव्य रणनीति विस्तार: मूल निर्धारक प्राकृतिक रणनीतियों को संभाव्य वितरण में विस्तारित करना, वास्तविक निर्णय लेने के करीब
नियमित अभिव्यक्ति शर्तें: नियमित अभिव्यक्तियों का उपयोग करना बजाय स्थिति इतिहास के, अपूर्ण जानकारी मॉडलिंग को लागू करना
जटिलता पैरामीटरकरण: रणनीति जटिलता k को सूत्र पैरामीटर के रूप में रखना, "कोई सरल रणनीति मौजूद नहीं है" जैसे गुण व्यक्त कर सकना
व्यवहारिक रणनीति शब्दार्थ: व्यवहारिक रणनीतियों (स्थिति-क्रिया संभावना) का उपयोग करना मिश्रित रणनीतियों के बजाय, गेम सिद्धांत में Kuhn समतुल्यता से संबंधित
दोहरी-स्तरीय विरोध: गठबंधन रणनीति अस्तित्व परिमाणीकरण + विरोधी रणनीति सार्वभौमिक परिमाणीकरण की नेस्टेड संरचना
Jamroga, W., Malvone, V., & Murano, A. (2019). Natural strategic ability. Artificial Intelligence, 277, 103170.
प्राकृतिक रणनीति की मूल परिभाषा
Aminof, B., et al. (2019). Probabilistic Strategy Logic. IJCAI.
PSL की 3EXPSPACE जटिलता
Chatterjee, K., Chmelik, M., & Davies, J. (2016). A Symbolic SAT-Based Algorithm for Almost-Sure Reachability with Small Strategies in POMDPs. AAAI.
POMDP बंधी हुई स्मृति रणनीति की NP-completeness
Baier, C., et al. (2012). Stochastic game logic. Acta Informatica, 49(4), 203-224.
स्टोकेस्टिक गेम तर्क की EXPSPACE जटिलता
Alur, R., Henzinger, T., & Kupferman, O. (2002). Alternating-time temporal logic. J. ACM, 49(5), 672-713.
ATL का शास्त्रीय पेपर
समग्र मूल्यांकन: यह स्टोकेस्टिक मल्टी-एजेंट सिस्टम सत्यापन क्षेत्र में एक उच्च गुणवत्ता वाला सैद्धांतिक कंप्यूटर विज्ञान पेपर है। सैद्धांतिक परिणाम कठोर और पूर्ण हैं, समस्या प्रेरणा पर्याप्त है, तकनीकी नवाचार महत्वपूर्ण है। मुख्य कमी प्रायोगिक सत्यापन और उपकरण कार्यान्वयन की कमी है। सैद्धांतिक अनुसंधानकर्ताओं और औपचारिक विधि अनुसंधानकर्ताओं के लिए, यह एक आवश्यक पठन है; व्यावहारिकों के लिए, उपकरण विकास और केस अध्ययन की प्रतीक्षा करनी होगी। पेपर की जटिलता परिणाम इस क्षेत्र के लिए महत्वपूर्ण सैद्धांतिक बेंचमार्क स्थापित करते हैं।