Natural Strategic Ability in Stochastic Multi-Agent Systems
Berthon, Katoen, Mittelmann et al.
Strategies synthesized using formal methods can be complex and often require infinite memory, which does not correspond to the expected behavior when trying to model Multi-Agent Systems (MAS). To capture such behaviors, natural strategies are a recently proposed framework striking a balance between the ability of agents to strategize with memory and the model-checking complexity, but until now has been restricted to fully deterministic settings. For the first time, we consider the probabilistic temporal logics PATL and PATL* under natural strategies (NatPATL and NatPATL*, resp.). As main result we show that, in stochastic MAS, NatPATL model-checking is NP-complete when the active coalition is restricted to deterministic strategies. We also give a 2NEXPTIME complexity result for NatPATL* with the same restriction. In the unrestricted case, we give an EXPSPACE complexity for NatPATL and 3EXPSPACE complexity for NatPATL*.
academic
القدرة الاستراتيجية الطبيعية في الأنظمة العشوائية متعددة الوكلاء
تقدم هذه الورقة للمرة الأولى توسيع إطار العمل للاستراتيجيات الطبيعية (natural strategies) إلى الأنظمة العشوائية متعددة الوكلاء (stochastic MAS)، وتقترح متغيرات من المنطق الزمني المتناوب الاحتمالي PATL و PATL* تحت الاستراتيجيات الطبيعية (NatPATL و NatPATL*). تشير النتائج الرئيسية إلى أنه عندما تقتصر الائتلافات على الاستراتيجيات الحتمية، يكون فحص نموذج NatPATL كاملاً في ∆P₂؛ بينما NatPATL* له تعقيد 2NEXPTIME. في الحالات غير المقيدة (الاستراتيجيات الاحتمالية)، يكون تعقيد NatPATL هو EXPSPACE و NatPATL* هو 3EXPSPACE. يحقق هذا العمل توازناً جيداً بين التحقق من القدرة الاستراتيجية للوكلاء ذوي الذاكرة المحدودة والتعقيد الحسابي.
الاستراتيجيات التي تنتجها أساليب التوليف الشكلية عادة ما تتمتع بتعقيد عالي وتتطلب ذاكرة غير محدودة، وهو أمر غير واقعي في نمذجة الأنظمة متعددة الوكلاء العملية. لا يستطيع الوكلاء البشريون والوكلاء الاصطناعيون ذوو الموارد المحدودة تنفيذ هذه الاستراتيجيات المعقدة.
PATL/PATL*: تتطلب استراتيجيات ذات ذاكرة غير محدودة، وعلى الرغم من أن تعقيد فحص النموذج في NP∩co-NP إلا أنه غير عملي
PSL: غير قابل للحسم؛ حتى مع تقييد الاستراتيجيات عديمة الذاكرة يتطلب 3EXPSPACE
منطق الألعاب العشوائية: الاستراتيجيات الحتمية عديمة الذاكرة تتطلب PSPACE، والاستراتيجيات الاحتمالية عديمة الذاكرة تتطلب EXPSPACE، لكن افتراض عدم وجود ذاكرة صارم جداً
الأبحاث الحالية حول الاستراتيجيات الطبيعية: مقتصرة على البيئات الحتمية بالكامل، غير قادرة على التعامل مع العشوائية
التوسيع النظري: توسيع إطار العمل للاستراتيجيات الطبيعية للمرة الأولى من البيئات الحتمية إلى الأنظمة العشوائية متعددة الوكلاء، مع تعريف الاستراتيجيات الطبيعية السلوكية (behavioral natural strategies)
أنظمة منطقية جديدة: اقتراح نظامي منطق NatPATL و NatPATL*، يدعمان دلالات عديمة الذاكرة (memoryless, r) والاستدعاء المحدود (bounded recall, R)
نتائج التعقيد (انظر الجدول 1 للملخص):
الاستراتيجيات الحتمية: NatPATLr/R كاملة في ∆P₂ (حد أدنى NP-hard)، NatPATL*r/R هي 2NEXPTIME
الاستراتيجيات الاحتمالية: NatPATLr/R هي EXPSPACE، NatPATL*r/R هي 3EXPSPACE
تحليل القوة التعبيرية: إثبات أن NatPATL() و PATL() لهما قوة تمييز وتعبير غير قابلة للمقارنة
أمثلة التطبيق: عرض القيمة العملية من خلال أنظمة التصويت الإلكتروني وأنظمة التحكم في الوصول
مشكلة فحص النموذج: بالنظر إلى هيكل اللعبة المتزامنة العشوائية (CGS) G والحالة s وصيغة NatPATL(*) φ، تحديد ما إذا كان G, s ⊨ρ φ صحيحاً (ρ∈{r,R} يشير إلى عديم الذاكرة أو الاستدعاء المحدود).
المدخلات:
CGS G = (St, L, δ, ℓ): مجموعة الحالات، دالة الشرعية، دالة الانتقال العشوائية، دالة التسمية
الحالة الأولية s ∈ St
صيغة NatPATL(*) φ، تتضمن حد التعقيد k
المخرجات: قيمة منطقية تشير إلى ما إذا كانت الصيغة مرضية
توسيع الاستراتيجيات الاحتمالية: توسيع الاستراتيجيات الطبيعية الأصلية الحتمية إلى توزيعات احتمالية، أقرب إلى صنع القرار الفعلي
شروط التعبير النمطي: استخدام التعبيرات النمطية بدلاً من سجل الحالة، تحقيق نمذجة المعلومات غير الكاملة
معاملة التعقيد: جعل تعقيد الاستراتيجية k معامل الصيغة، يمكن التعبير عن "لا توجد استراتيجية بسيطة"
دلالات الاستراتيجية السلوكية: استخدام الاستراتيجيات السلوكية (احتمالية الحالة-الإجراء) بدلاً من الاستراتيجيات المختلطة (احتمالية اختيار الاستراتيجية)، المتعلقة بتكافؤ Kuhn في نظرية الألعاب
Jamroga, W., Malvone, V., & Murano, A. (2019). Natural strategic ability. Artificial Intelligence, 277, 103170.
التعريف الأصلي للاستراتيجيات الطبيعية
Aminof, B., et al. (2019). Probabilistic Strategy Logic. IJCAI.
تعقيد PSL 3EXPSPACE
Chatterjee, K., Chmelik, M., & Davies, J. (2016). A Symbolic SAT-Based Algorithm for Almost-Sure Reachability with Small Strategies in POMDPs. AAAI.
NP-completeness لاستراتيجيات POMDP ذات الذاكرة المحدودة
Baier, C., et al. (2012). Stochastic game logic. Acta Informatica, 49(4), 203-224.
تعقيد منطق الألعاب العشوائية EXPSPACE
Alur, R., Henzinger, T., & Kupferman, O. (2002). Alternating-time temporal logic. J. ACM, 49(5), 672-713.
الورقة الكلاسيكية لـ ATL
التقييم الإجمالي: هذه ورقة عالية الجودة في علوم الحاسوب النظرية، تقدم مساهمات مهمة في مجال التحقق من الأنظمة العشوائية متعددة الوكلاء. النتائج النظرية صارمة وكاملة، والدافع للمشكلة كافٍ، والابتكار التقني كبير. أوجه القصور الرئيسية تتعلق بغياب التحقق التجريبي وتطبيق الأدوات. بالنسبة للباحثين النظريين والمتخصصين في الأساليب الشكلية، هذه ورقة يجب قراءتها؛ بالنسبة للممارسين، يتطلب الأمر انتظار تطوير الأدوات والدراسات الحالات اللاحقة. تحدد نتائج التعقيد في الورقة معايير نظرية مهمة لهذا المجال.