Formally Verified Certification of Unsolvability of Temporal Planning Problems
Wang, Abdulaziz
We present an approach to unsolvability certification of temporal planning. Our approach is based on encoding the planning problem into a network of timed automata, and then using an efficient model checker on the network followed by a certificate checker to certify the output of the model checker. Our approach prioritises trustworthiness of the certification: we formally verify our implementation of the encoding to timed automata using the theorem prover Isabelle/HOL and we use an existing certificate checker (also formally verified in Isabelle/HOL) to certify the model checking result.
academic
Certificación Formalmente Verificada de la Insolubilidad de Problemas de Planificación Temporal
Este artículo propone un método para la certificación de insolubilidad de problemas de planificación temporal. El método se basa en codificar problemas de planificación como redes de autómatas temporales, aplicar verificadores de modelos eficientes en la red y, posteriormente, utilizar verificadores de certificados para autenticar la salida del verificador de modelos. El método prioriza la confiabilidad de la certificación: utiliza el demostrador de teoremas Isabelle/HOL para verificar formalmente la implementación de la codificación de autómatas temporales, y emplea un verificador de certificados existente (también verificado formalmente en Isabelle/HOL) para autenticar los resultados de la verificación de modelos.
El problema central que aborda esta investigación es la certificación de insolubilidad de problemas de planificación temporal. La planificación temporal es una forma de planificación más rica que permite que las acciones tengan duración y se ejecuten de manera concurrente, siendo considerablemente más compleja que la planificación clásica.
Requisitos de Confiabilidad: Los sistemas de planificación existentes son extremadamente complejos tanto a nivel algorítmico como de implementación, por lo que es crucial mejorar la confiabilidad de sus resultados
Dificultad de Certificación: A diferencia de los problemas solubles (que pueden verificarse ejecutando un plan), las afirmaciones de insolubilidad u optimalidad son difíciles de certificar de manera compacta
Complejidad Exponencial: En el peor caso, tales certificados pueden crecer exponencialmente con respecto al tamaño de la tarea de planificación
Falta de Garantías Formales: Los métodos existentes para detectar insolubilidad en planificación temporal carecen de garantías formales de corrección
Alta Complejidad: Las técnicas algorítmicas más avanzadas en planificación temporal tienen una complejidad muy alta, lo que dificulta el diseño de esquemas prácticos de certificación de insolubilidad
Vacío en Verificación: En comparación con el trabajo de verificación formal existente en planificación clásica, existe un vacío en este aspecto para planificación temporal
Este artículo adopta un enfoque de transformación de codificación: codifica problemas de planificación temporal en otros problemas computacionales para los cuales existen algoritmos de certificación prácticos (autómatas temporales), y verifica formalmente todo el proceso de codificación y el verificador de certificados mediante un demostrador de teoremas, asegurando la confiabilidad de la certificación.
Método de Codificación Verificado Formalmente: Primera verificación formal de la codificación de planificación temporal a autómatas temporales de Heinz et al.
Implementación de Ingeniería: Adaptación de la codificación para producir formatos de autómatas temporales compatibles con el sistema de Wimmer y von Mutius
Diseño de Semántica Simplificada: Diseño de una semántica de planificación temporal más simple que trabajos previos, facilitando el razonamiento matemático, con prueba de equivalencia con semánticas existentes
Marco de Certificación Completo: Construcción de una cadena de certificación confiable completa desde problemas de planificación temporal hasta verificación de modelos de autómatas temporales
Garantías de Corrección Teórica: Prueba de corrección de la codificación en Isabelle/HOL, proporcionando garantías teóricas sólidas
Para cada proposición p: variable binaria vp (codificando valor de verdad) y contador de bloqueo lp (registrando acciones activas que requieren que p sea verdadero)
aa: número total de acciones activas
ps: estado de planificación (0=no iniciado, 1=en planificación, 2=completado)
Diseño de Relojes (Definición 25):
Dos relojes asignados a cada acción a: ca⊢ (registrando tiempo después del inicio) y ca⊣ (registrando tiempo después del fin)
Autómata Principal (Definición 26):
Controla las transiciones de estado de todo el proceso de planificación, incluyendo inicialización y verificación de objetivo.
Autómatas de Acción (Definición 27):
Cada acción corresponde a un autómata, conteniendo las siguientes transiciones clave:
Combinación del autómata principal y todos los autómatas de acción en una red de autómatas temporales (Definición 28), con configuración inicial estableciendo todos los autómatas en estado inactivo.
Soporte para Ejecución Concurrente: A diferencia de Heinz et al. que utilizan bloqueos globales, este trabajo utiliza restricciones de reloj permitiendo ejecución concurrente de acciones de captura
Manejo de Acciones Instantáneas: Soporte para acciones de duración cero mediante la adición de transiciones iea
Verificación Formal: Primera provisión de pruebas de corrección verificadas por máquina para tales codificaciones
Simplificación de Semántica: Diseño de semántica de planificación temporal más adecuada para razonamiento formal
Teorema 1 (Teorema de Corrección Principal):
Si el plan π es válido y sin auto-solapamiento (valid(π) ∧ no_self_overlap(π)), entonces se cumple la afirmación A ⊨ EF(loc(AM) = goal).
Estructura de Prueba:
Lema 1: Construcción de simulación induciendo ejecución de plan paralelo
Lema 2: Alcanzabilidad desde configuración inicial a estado codificado
Lema 3: Transición desde estado final a configuración de objetivo
Prueba de Completitud: Prueba exitosa de completitud de la codificación, es decir, cada plan válido puede encontrar una ejecución válida en la red de autómatas temporales correspondiente
Verificación por Máquina: Todas las pruebas han sido verificadas por máquina mediante Isabelle/HOL, proporcionando el más alto nivel de garantía de confiabilidad
Diseño Modular: Estructura de prueba modular, facilitando comprensión y mantenimiento
La implementación de codificación ha sido adaptada al formato compatible con verificadores de certificados verificados existentes, formando una cadena de certificación completamente ejecutable.
Abdulaziz & Koller (2022): Semántica formal y verificador para planificación temporal
Heinz et al. (2019): Codificación de planificación temporal a autómatas temporales
Wimmer & von Mutius (2020): Verificador de certificados verificado para autómatas temporales
Abdulaziz & Kurz (2023): Sistema de planificación basado en SAT verificado
Este artículo realiza contribuciones importantes en el campo de la verificación formal de planificación temporal. Aunque aún hay espacio para mejora en aspectos de practicidad, su rigor teórico e innovación metodológica sientan una base sólida para el desarrollo futuro de este campo.