2025-11-15T12:40:11.869613

Formally Verified Certification of Unsolvability of Temporal Planning Problems

Wang, Abdulaziz

We present an approach to unsolvability certification of temporal planning. Our approach is based on encoding the planning problem into a network of timed automata, and then using an efficient model checker on the network followed by a certificate checker to certify the output of the model checker. Our approach prioritises trustworthiness of the certification: we formally verify our implementation of the encoding to timed automata using the theorem prover Isabelle/HOL and we use an existing certificate checker (also formally verified in Isabelle/HOL) to certify the model checking result.

academic

Certificación Formalmente Verificada de la Insolubilidad de Problemas de Planificación Temporal

Información Básica

ID del Artículo: 2510.10189
Título: Formally Verified Certification of Unsolvability of Temporal Planning Problems
Autores: David Wang, Mohammad Abdulaziz (King's College London, Reino Unido)
Clasificación: cs.LO (Lógica en Informática), cs.AI (Inteligencia Artificial)
Fecha de Publicación: 11 de octubre de 2025 (preimpresión en arXiv)
Enlace del Artículo: https://arxiv.org/abs/2510.10189

Resumen

Este artículo propone un método para la certificación de insolubilidad de problemas de planificación temporal. El método se basa en codificar problemas de planificación como redes de autómatas temporales, aplicar verificadores de modelos eficientes en la red y, posteriormente, utilizar verificadores de certificados para autenticar la salida del verificador de modelos. El método prioriza la confiabilidad de la certificación: utiliza el demostrador de teoremas Isabelle/HOL para verificar formalmente la implementación de la codificación de autómatas temporales, y emplea un verificador de certificados existente (también verificado formalmente en Isabelle/HOL) para autenticar los resultados de la verificación de modelos.

Contexto de Investigación y Motivación

Problema Central

El problema central que aborda esta investigación es la certificación de insolubilidad de problemas de planificación temporal. La planificación temporal es una forma de planificación más rica que permite que las acciones tengan duración y se ejecuten de manera concurrente, siendo considerablemente más compleja que la planificación clásica.

Importancia del Problema

Requisitos de Confiabilidad: Los sistemas de planificación existentes son extremadamente complejos tanto a nivel algorítmico como de implementación, por lo que es crucial mejorar la confiabilidad de sus resultados
Dificultad de Certificación: A diferencia de los problemas solubles (que pueden verificarse ejecutando un plan), las afirmaciones de insolubilidad u optimalidad son difíciles de certificar de manera compacta
Complejidad Exponencial: En el peor caso, tales certificados pueden crecer exponencialmente con respecto al tamaño de la tarea de planificación

Limitaciones de Métodos Existentes

Falta de Garantías Formales: Los métodos existentes para detectar insolubilidad en planificación temporal carecen de garantías formales de corrección
Alta Complejidad: Las técnicas algorítmicas más avanzadas en planificación temporal tienen una complejidad muy alta, lo que dificulta el diseño de esquemas prácticos de certificación de insolubilidad
Vacío en Verificación: En comparación con el trabajo de verificación formal existente en planificación clásica, existe un vacío en este aspecto para planificación temporal

Motivación de la Investigación

Este artículo adopta un enfoque de transformación de codificación: codifica problemas de planificación temporal en otros problemas computacionales para los cuales existen algoritmos de certificación prácticos (autómatas temporales), y verifica formalmente todo el proceso de codificación y el verificador de certificados mediante un demostrador de teoremas, asegurando la confiabilidad de la certificación.

Contribuciones Principales

Método de Codificación Verificado Formalmente: Primera verificación formal de la codificación de planificación temporal a autómatas temporales de Heinz et al.
Implementación de Ingeniería: Adaptación de la codificación para producir formatos de autómatas temporales compatibles con el sistema de Wimmer y von Mutius
Diseño de Semántica Simplificada: Diseño de una semántica de planificación temporal más simple que trabajos previos, facilitando el razonamiento matemático, con prueba de equivalencia con semánticas existentes
Marco de Certificación Completo: Construcción de una cadena de certificación confiable completa desde problemas de planificación temporal hasta verificación de modelos de autómatas temporales
Garantías de Corrección Teórica: Prueba de corrección de la codificación en Isabelle/HOL, proporcionando garantías teóricas sólidas

Explicación Detallada del Método

Definición de la Tarea

Entrada: Problema de planificación temporal P = ⟨P, A, I, G⟩

P: conjunto de proposiciones
A: conjunto de acciones de duración
I: estado inicial
G: condiciones de objetivo

Salida: Certificado formal de insolubilidad (si el problema es efectivamente insoluble)

Restricciones:

Las acciones poseen acciones de captura de inicio y fin
Soporte para condiciones invariantes y restricciones de programación
Satisfacción de restricciones de exclusión mutua y límites de duración

Arquitectura del Modelo

1. Formalización de Planificación Temporal

El artículo define primero la semántica formal de la planificación temporal:

Acciones de Captura (Definición 1):

h ≡ ⟨pre(h), adds(h), dels(h)⟩

Acciones de Duración (Definición 2):

a ≡ ⟨a⊢, a⊣, over_all(a), L(a), U(a)⟩

donde a⊢ y a⊣ son las acciones de captura de inicio y fin respectivamente.

2. Codificación de Autómatas Temporales

Diseño de Variables (Definición 24):

Para cada proposición p: variable binaria vp (codificando valor de verdad) y contador de bloqueo lp (registrando acciones activas que requieren que p sea verdadero)
aa: número total de acciones activas
ps: estado de planificación (0=no iniciado, 1=en planificación, 2=completado)

Diseño de Relojes (Definición 25):

Dos relojes asignados a cada acción a: ca⊢ (registrando tiempo después del inicio) y ca⊣ (registrando tiempo después del fin)

Autómata Principal (Definición 26): Controla las transiciones de estado de todo el proceso de planificación, incluyendo inicialización y verificación de objetivo.

Autómatas de Acción (Definición 27): Cada acción corresponde a un autómata, conteniendo las siguientes transiciones clave:

sea: aplicación de efectos de inicio de acción
se'a: bloqueo de condiciones invariantes
eea: preparación antes del fin
ee'a: aplicación de efectos de fin de acción
iea: manejo de acciones instantáneas

3. Construcción de Red

Combinación del autómata principal y todos los autómatas de acción en una red de autómatas temporales (Definición 28), con configuración inicial estableciendo todos los autómatas en estado inactivo.

Puntos de Innovación Técnica

Soporte para Ejecución Concurrente: A diferencia de Heinz et al. que utilizan bloqueos globales, este trabajo utiliza restricciones de reloj permitiendo ejecución concurrente de acciones de captura
Manejo de Acciones Instantáneas: Soporte para acciones de duración cero mediante la adición de transiciones iea
Verificación Formal: Primera provisión de pruebas de corrección verificadas por máquina para tales codificaciones
Simplificación de Semántica: Diseño de semántica de planificación temporal más adecuada para razonamiento formal

Configuración Experimental

Entorno de Verificación Formal

Demostrador de Teoremas: Isabelle/HOL
Verificador de Certificados: Verificador de certificados verificado de Wimmer y von Mutius
Propiedad Objetivo: Verificación de alcanzabilidad A ⊨ EF(loc(AM) = goal)

Estadísticas de Código

Componente	Líneas de Código
Formalización de semántica abstracta de planificación temporal	~7,200
Definición de red de autómatas temporales usando Munta	~800
Prueba del Teorema 1 y lemas relacionados	~8,500
Lemas relacionados con listas	~1,500
Total	~18,000

Comparación con Trabajos Relacionados

Comparación de escala con trabajos de verificación formal relacionados:

Planificador basado en SAT verificado: ~17,500 líneas
Verificador de planificación clásica verificado: ~3,000 líneas
Verificador de planificación temporal PDDL verificado: ~6,500 líneas

Resultados Experimentales

Resultados Teóricos Principales

Teorema 1 (Teorema de Corrección Principal): Si el plan π es válido y sin auto-solapamiento (valid(π) ∧ no_self_overlap(π)), entonces se cumple la afirmación A ⊨ EF(loc(AM) = goal).

Estructura de Prueba:

Lema 1: Construcción de simulación induciendo ejecución de plan paralelo
Lema 2: Alcanzabilidad desde configuración inicial a estado codificado
Lema 3: Transición desde estado final a configuración de objetivo

Logros de Verificación Formal

Prueba de Completitud: Prueba exitosa de completitud de la codificación, es decir, cada plan válido puede encontrar una ejecución válida en la red de autómatas temporales correspondiente
Verificación por Máquina: Todas las pruebas han sido verificadas por máquina mediante Isabelle/HOL, proporcionando el más alto nivel de garantía de confiabilidad
Diseño Modular: Estructura de prueba modular, facilitando comprensión y mantenimiento

Verificación de Implementación de Ingeniería

La implementación de codificación ha sido adaptada al formato compatible con verificadores de certificados verificados existentes, formando una cadena de certificación completamente ejecutable.

Trabajo Relacionado

Certificación en Planificación Clásica

Eriksson et al. diseñaron esquemas compactos de certificación de insolubilidad para planificación clásica
Abdulaziz y Lammich proporcionaron verificadores formales para planificación clásica

Planificación Temporal y Verificación de Modelos

Dierks et al. implementaron reducción estática de subconjunto PDDL a autómatas temporales
Heinz et al. definieron codificación explícita de problemas de planificación temporal a autómatas temporales
Gigante et al. estudiaron complejidad de planificación temporal a nivel teórico

Métodos de Verificación Formal

Abdulaziz y Kurz utilizaron método similar para desarrollar sistema de planificación basado en SAT certificado
Kumar et al. y Leroy utilizaron método de verificación gradual de codificación en verificación de compiladores

Conclusiones y Discusión

Conclusiones Principales

Verificación de Viabilidad: Demuestra que la certificación formal de insolubilidad en planificación temporal es viable
Garantías Teóricas: Proporciona garantías sólidas de corrección mediante demostrador de teoremas
Implementación de Ingeniería: Construcción exitosa de cadena de herramientas de certificación completa

Limitaciones

Restricciones de Entrada: Actualmente solo acepta problemas de planificación temporal ya instanciados como entrada
Subconjunto de Semántica: La semántica soportada es un subconjunto del verificador de planificación verificado existente
Ejecutabilidad: El mecanismo de certificación aún no es completamente ejecutable

Direcciones Futuras

Prueba de Equivalencia: Planificación para prueba formal de equivalencia entre semántica de este trabajo y semántica de verificadores existentes
Implementación Ejecutable: Desarrollo de verificador de certificados ejecutable
Verificación de Instanciación: Verificación formal de algoritmos de instanciación, como el solucionador de registro de datos de Helmert
Relajación de Restricciones: Investigación de posibilidades de relajar la condición de no auto-solapamiento

Evaluación Profunda

Fortalezas

Rigor Teórico: Primera provisión de prueba formal verificada por máquina para certificación de insolubilidad en planificación temporal
Completitud de Ingeniería: No solo proporciona marco teórico, sino también implementa integración con herramientas existentes
Innovación Metodológica:
- Diseño de codificación que soporta ejecución concurrente
- Solución elegante para manejo de acciones instantáneas
- Diseño de semántica simplificada pero equivalente
Garantía de Confiabilidad: Proporciona el más alto nivel de garantía de corrección mediante demostrador de teoremas

Deficiencias

Limitaciones de Practicidad:
- Requiere entrada pre-instanciada
- Aún no completamente ejecutable
- Carece de evaluación de rendimiento
Rango de Cobertura: Solo soporta subconjunto de planificación temporal, no características PDDL completas
Escalabilidad: Escala de trabajo formal de 18,000 líneas de código es relativamente grande, con alto costo de mantenimiento

Impacto

Contribución Académica:
- Llena vacío en verificación formal de planificación temporal
- Proporciona nueva base teórica para certificación de insolubilidad
- Demuestra viabilidad de verificación formal de sistemas complejos
Valor Práctico:
- Proporciona certificación confiable de sistemas de planificación para aplicaciones críticas
- Extensible a otras formas de planificación y problemas de satisfacción de restricciones
- Proporciona referencia para desarrollo de herramientas de verificación automatizada
Reproducibilidad: Basado en Isabelle/HOL de código abierto, teóricamente completamente reproducible

Escenarios de Aplicación

Sistemas Críticos: Aplicaciones de planificación que requieren garantías de alta confiabilidad (como aeroespacial, dispositivos médicos)
Herramientas de Investigación: Proporciona infraestructura de verificación formal para investigación en planificación temporal
Propósitos Educativos: Sirve como caso de estudio para enseñanza de métodos formales y algoritmos de planificación
Desarrollo de Herramientas: Proporciona base teórica para desarrollo de herramientas de planificación confiables

Referencias Bibliográficas

Las referencias clave incluyen:

Abdulaziz & Koller (2022): Semántica formal y verificador para planificación temporal
Heinz et al. (2019): Codificación de planificación temporal a autómatas temporales
Wimmer & von Mutius (2020): Verificador de certificados verificado para autómatas temporales
Abdulaziz & Kurz (2023): Sistema de planificación basado en SAT verificado

Este artículo realiza contribuciones importantes en el campo de la verificación formal de planificación temporal. Aunque aún hay espacio para mejora en aspectos de practicidad, su rigor teórico e innovación metodológica sientan una base sólida para el desarrollo futuro de este campo.