Efficient Shield Synthesis via State-Space Transformation
Brorholt, Høeg-Petersen, Larsen et al.
We consider the problem of synthesizing safety strategies for control systems, also known as shields. Since the state space is infinite, shields are typically computed over a finite-state abstraction, with the most common abstraction being a rectangular grid. However, for many systems, such a grid does not align well with the safety property or the system dynamics. That is why a coarse grid is rarely sufficient, but a fine grid is typically computationally infeasible to obtain. In this paper, we show that appropriate state-space transformations can still allow to use a coarse grid at almost no computational overhead. We demonstrate in three case studies that our transformation-based synthesis outperforms a standard synthesis by several orders of magnitude. In the first two case studies, we use domain knowledge to select a suitable transformation. In the third case study, we instead report on results in engineering a transformation without domain knowledge.
academic
Síntesis Eficiente de Escudos mediante Transformación del Espacio de Estados
Este artículo investiga el problema de síntesis de políticas de seguridad para sistemas de control, también conocido como síntesis de escudos. Debido a que el espacio de estados es infinito, los escudos se calculan típicamente sobre abstracciones de estados finitos, siendo la más común la malla rectangular. Sin embargo, para muchos sistemas, esta malla se alinea mal con las propiedades de seguridad o la dinámica del sistema. Las mallas gruesas suelen ser insuficientes, mientras que las mallas finas a menudo son computacionalmente inviables. Este artículo demuestra que transformaciones apropiadas del espacio de estados permiten seguir utilizando mallas gruesas con prácticamente ningún costo computacional adicional. Mediante tres estudios de caso, se demuestra que el método de síntesis basado en transformación mejora el rendimiento respecto al método de síntesis estándar en varios órdenes de magnitud.
El problema central que aborda esta investigación es cómo sintetizar de manera eficiente políticas de seguridad (escudos) para sistemas de control. En sistemas ciber-físicos, los controladores digitales necesitan garantizar la seguridad del sistema, lo que ha motivado el desarrollo de métodos automáticos de construcción de controladores.
Criticidad de Seguridad: Muchos sistemas ciber-físicos son críticos para la seguridad y requieren garantías de seguridad formalizadas
Complementariedad de Métodos: El aprendizaje por refuerzo proporciona optimalidad pero carece de garantías de seguridad, mientras que la síntesis reactiva proporciona garantías de seguridad pero carece de optimalidad
Marco de Escudos: Combina las ventajas de ambos métodos, previniendo acciones inseguras durante el proceso de aprendizaje mediante escudos
Mediante transformaciones del espacio de estados, alinear mejor la malla con la dinámica del sistema en el nuevo espacio de estados, mejorando así la calidad de la síntesis mientras se mantiene la eficiencia computacional.
Se propone un método de síntesis de escudos basado en transformación del espacio de estados, que puede reducir significativamente el número de celdas de malla requeridas
Se demuestra la corrección teórica del método de transformación, incluyendo la transferencia de garantías de seguridad del espacio transformado al espacio original
Se valida la efectividad del método en tres estudios de caso, con mejoras de rendimiento de varios órdenes de magnitud
Se proporciona un método de ingeniería de transformación sin conocimiento de dominio, ampliando la aplicabilidad del método
Se implementa la integración con aprendizaje por refuerzo, demostrando el valor de aplicación práctica
En comparación de recompensa acumulada en 1000 episodios:
Modelo de Satélite: El escudo transformado alcanza la máxima recompensa de 1.499
Modelo de Pelota Rebotante: El escudo transformado alcanza el costo mínimo de 36.593
Péndulo Invertido: El escudo transformado alcanza el costo mínimo de 0.000
Los resultados demuestran que el escudo transformado no solo es computacionalmente más eficiente, sino que también tiene un rendimiento práctico superior.
La transformación del espacio de estados es una herramienta poderosa para la síntesis de escudos, capaz de mejorar significativamente la eficiencia computacional
La corrección teórica está garantizada, las propiedades de seguridad se transfieren correctamente del espacio transformado al espacio original
El valor de aplicación práctica es alto, mejorando no solo la eficiencia computacional sino también el rendimiento del control
El método tiene universalidad, siendo aplicable a múltiples tipos de sistemas de control
El artículo cita 31 referencias relacionadas, cubriendo trabajos importantes en múltiples campos incluyendo teoría de control, métodos formales, aprendizaje por refuerzo e interpretación abstracta, proporcionando una base teórica sólida para la investigación.
Evaluación General: Este es un artículo de investigación de alta calidad que propone una solución innovadora para abordar los desafíos computacionales en la síntesis de escudos. El método tiene una base teórica sólida y un valor práctico significativo, haciendo una contribución importante al campo de síntesis de seguridad de sistemas de control.