Efficient Shield Synthesis via State-Space Transformation
Brorholt, Høeg-Petersen, Larsen et al.
We consider the problem of synthesizing safety strategies for control systems, also known as shields. Since the state space is infinite, shields are typically computed over a finite-state abstraction, with the most common abstraction being a rectangular grid. However, for many systems, such a grid does not align well with the safety property or the system dynamics. That is why a coarse grid is rarely sufficient, but a fine grid is typically computationally infeasible to obtain. In this paper, we show that appropriate state-space transformations can still allow to use a coarse grid at almost no computational overhead. We demonstrate in three case studies that our transformation-based synthesis outperforms a standard synthesis by several orders of magnitude. In the first two case studies, we use domain knowledge to select a suitable transformation. In the third case study, we instead report on results in engineering a transformation without domain knowledge.
academic
Эффективный синтез защиты посредством преобразования пространства состояний
В данной работе исследуется проблема синтеза политик безопасности для систем управления, также известная как синтез защиты (shield). Поскольку пространство состояний бесконечно, защита обычно вычисляется на конечных абстракциях состояний, наиболее распространённой из которых является прямоугольная сетка. Однако для многих систем такая сетка плохо согласуется с свойствами безопасности или динамикой системы. Грубая сетка часто недостаточна, а тонкая сетка обычно вычислительно неосуществима. В статье показано, что надлежащее преобразование пространства состояний позволяет использовать грубую сетку практически без вычислительных затрат. На трёх практических примерах продемонстрировано, что метод синтеза на основе преобразований обеспечивает производительность на несколько порядков выше, чем стандартный метод синтеза.
Основная проблема, которую решает данное исследование, заключается в том, как эффективно синтезировать политики безопасности (защиту) для систем управления. В киберфизических системах цифровые контроллеры должны гарантировать безопасность системы, что стимулирует развитие методов автоматического построения контроллеров.
Критичность по безопасности: Многие киберфизические системы являются критичными по безопасности и требуют формальных гарантий безопасности
Дополнительность методов: Обучение с подкреплением обеспечивает оптимальность, но не гарантирует безопасность, тогда как реактивный синтез гарантирует безопасность, но не оптимальность
Фреймворк защиты: Объединяет преимущества обоих подходов, предотвращая небезопасные действия во время обучения посредством защиты
Посредством преобразования пространства состояний лучше согласовать сетку с динамикой системы в новом пространстве состояний, обеспечивая повышение качества синтеза при сохранении вычислительной эффективности.
Предложен метод синтеза защиты на основе преобразования пространства состояний, способный значительно сократить количество необходимых ячеек сетки
Доказана теоретическая корректность метода преобразования, включая передачу гарантий безопасности из преобразованного пространства в исходное пространство
Подтверждена эффективность метода на трёх практических примерах, с повышением производительности на несколько порядков
Предоставлен метод инженерии преобразований без знания предметной области, расширяющий применимость метода
Реализована интеграция с обучением с подкреплением, демонстрирующая практическую ценность
Статья цитирует 31 связанную работу, охватывающую важные работы в области теории управления, формальных методов, обучения с подкреплением и абстрактной интерпретации, обеспечивая прочную теоретическую основу для исследования.
Общая оценка: Это высококачественная исследовательская работа, предлагающая инновационное решение для преодоления вычислительных проблем при синтезе защиты. Метод имеет прочную теоретическую основу и значительную практическую ценность, внося важный вклад в область синтеза безопасности систем управления.