Natural Strategic Ability in Stochastic Multi-Agent Systems
Berthon, Katoen, Mittelmann et al.
Strategies synthesized using formal methods can be complex and often require infinite memory, which does not correspond to the expected behavior when trying to model Multi-Agent Systems (MAS). To capture such behaviors, natural strategies are a recently proposed framework striking a balance between the ability of agents to strategize with memory and the model-checking complexity, but until now has been restricted to fully deterministic settings. For the first time, we consider the probabilistic temporal logics PATL and PATL* under natural strategies (NatPATL and NatPATL*, resp.). As main result we show that, in stochastic MAS, NatPATL model-checking is NP-complete when the active coalition is restricted to deterministic strategies. We also give a 2NEXPTIME complexity result for NatPATL* with the same restriction. In the unrestricted case, we give an EXPSPACE complexity for NatPATL and 3EXPSPACE complexity for NatPATL*.
academic
Естественная стратегическая способность в стохастических многоагентных системах
В данной работе впервые расширяется фреймворк естественных стратегий (natural strategies) на стохастические многоагентные системы (MAS), предлагаются варианты вероятностной чередующейся временной логики PATL и PATL* при естественных стратегиях (NatPATL и NatPATL*). Основные результаты показывают: когда коалиция ограничена детерминированными стратегиями, проверка моделей NatPATL является ∆P₂-полной; NatPATL* имеет сложность 2NEXPTIME. В неограниченном случае (вероятностные стратегии) сложность NatPATL составляет EXPSPACE, NatPATL* — 3EXPSPACE. Данная работа достигает хорошего баланса между верификацией стратегической способности агентов с конечной памятью и вычислительной сложностью.
Стратегии, синтезированные методами формальной верификации, обычно имеют высокую сложность и требуют бесконечной памяти, что нереалистично при моделировании реальных многоагентных систем. Человеческие агенты и искусственные агенты с ограниченными вычислительными ресурсами не могут выполнять такие сложные стратегии.
Практические требования: Реальные агенты (люди или ограниченные ИИ) нуждаются в исполняемых и понятных стратегиях
Моделирование неопределённости: MAS часто сталкиваются со стохастичностью (природные события, поведение агентов, ошибки датчиков и т.д.)
Критичные по безопасности приложения: Электронные системы голосования, контроль доступа и другие требуют верификации стратегической способности в неопределённой среде
PATL/PATL*: Требуют стратегий с бесконечной памятью; хотя сложность проверки моделей находится в NP∩co-NP, это непрактично
PSL: Неразрешима; даже при ограничении до стратегий без памяти требует 3EXPSPACE
Логика стохастических игр: Стратегии без памяти и детерминированные — PSPACE, без памяти и вероятностные — EXPSPACE, но предположение об отсутствии памяти слишком строго
Существующие исследования естественных стратегий: Ограничены полностью детерминированной средой, не могут обрабатывать стохастичность
Теоретическое расширение: Впервые расширяется фреймворк естественных стратегий из детерминированной среды на стохастические многоагентные системы, определяются поведенческие естественные стратегии (behavioral natural strategies)
Новые логические системы: Предлагаются две логические системы NatPATL и NatPATL*, поддерживающие две семантики: без памяти (memoryless, r) и с ограниченным воспоминанием (bounded recall, R)
Результаты сложности (см. таблицу 1):
Детерминированные стратегии: NatPATLr/R является ∆P₂-полной (нижняя граница NP-hard), NatPATL*r/R — 2NEXPTIME
Проблема проверки моделей: Дана стохастическая структура параллельных игр (CGS) G, состояние s и формула NatPATL(*) φ, определить, выполняется ли G, s ⊨ρ φ (ρ∈{r,R} обозначает без памяти или с ограниченным воспоминанием).
Входные данные:
CGS G = (St, L, δ, ℓ): множество состояний, функция легальности, функция стохастического перехода, функция разметки
Начальное состояние s ∈ St
Формула NatPATL(*) φ, включающая границу сложности k
Выходные данные: Булево значение, указывающее, выполняется ли формула
Для истории h стратегия выбирает первое правило, удовлетворяющее условию:
match(h, σₐ) = min{i : h согласуется с condᵢ(σₐ) и actᵢ(σₐ) легально в last(h)}
История h согласуется с регулярным выражением r тогда и только тогда, когда существует слово b∈L(r) такое, что каждое состояние h удовлетворяет соответствующей булевой формуле в b.
Расширение на вероятностные стратегии: Расширение исходно детерминированных естественных стратегий на вероятностные распределения, более близкое к реальному принятию решений
Условия регулярного выражения: Использование регулярных выражений вместо истории состояний для моделирования неполной информации
Параметризация сложности: Сложность стратегии k как параметр формулы позволяет выражать свойства типа "не существует простой стратегии"
Семантика поведенческих стратегий: Использование поведенческих стратегий (вероятности состояние-действие) вместо смешанных стратегий (вероятности выбора стратегии), связано с эквивалентностью Куна в теории игр
Двухуровневая антагонистичность: Вложенная структура экзистенциальной квантификации коалиционной стратегии и универсальной квантификации стратегии противника
Заключение: NatPATL() и PATL() имеют несравнимую различающую способность и выразительность
Идея доказательства:
NatPATL ⊀_d PATL: Естественные стратегии могут выражать "не существует стратегии сложности ≤k", что комбинаторные стратегии не могут выразить
PATL ⊀_d NatPATL: Комбинаторные стратегии могут выражать некоторые свойства, требующие бесконечной памяти, которые естественные стратегии не могут выразить
Из различающей способности выводится несравнимость выразительности
Jamroga, W., Malvone, V., & Murano, A. (2019). Natural strategic ability. Artificial Intelligence, 277, 103170.
Исходное определение естественных стратегий
Aminof, B., et al. (2019). Probabilistic Strategy Logic. IJCAI.
Сложность PSL 3EXPSPACE
Chatterjee, K., Chmelik, M., & Davies, J. (2016). A Symbolic SAT-Based Algorithm for Almost-Sure Reachability with Small Strategies in POMDPs. AAAI.
NP-полнота стратегий с ограниченной памятью в POMDP
Baier, C., et al. (2012). Stochastic game logic. Acta Informatica, 49(4), 203-224.
Сложность EXPSPACE логики стохастических игр
Alur, R., Henzinger, T., & Kupferman, O. (2002). Alternating-time temporal logic. J. ACM, 49(5), 672-713.
Классическая статья по ATL
Общая оценка: Это высококачественная статья в области теоретической информатики, вносящая важный вклад в область верификации стохастических многоагентных систем. Теоретические результаты строги и полны, проблема хорошо мотивирована, технические инновации значительны. Основной недостаток заключается в отсутствии экспериментальной верификации и реализации инструментов. Для теоретиков и исследователей формальных методов это обязательная к прочтению работа; для практиков необходимо дождаться последующей разработки инструментов и исследований на примерах. Результаты сложности в данной работе устанавливают важный теоретический эталон для этой области.