2025-11-15T12:40:11.869613

Formally Verified Certification of Unsolvability of Temporal Planning Problems

Wang, Abdulaziz

We present an approach to unsolvability certification of temporal planning. Our approach is based on encoding the planning problem into a network of timed automata, and then using an efficient model checker on the network followed by a certificate checker to certify the output of the model checker. Our approach prioritises trustworthiness of the certification: we formally verify our implementation of the encoding to timed automata using the theorem prover Isabelle/HOL and we use an existing certificate checker (also formally verified in Isabelle/HOL) to certify the model checking result.

academic

Certification Formellement Vérifiée de l'Insolvabilité des Problèmes de Planification Temporelle

Informations Fondamentales

ID de l'article : 2510.10189
Titre : Formally Verified Certification of Unsolvability of Temporal Planning Problems
Auteurs : David Wang, Mohammad Abdulaziz (King's College London, Royaume-Uni)
Classification : cs.LO (Logique en Informatique), cs.AI (Intelligence Artificielle)
Date de publication : 11 octobre 2025 (prépublication arXiv)
Lien de l'article : https://arxiv.org/abs/2510.10189

Résumé

Cet article propose une méthode de certification de l'insolvabilité des problèmes de planification temporelle. La méthode repose sur l'encodage des problèmes de planification en réseaux d'automates temporisés, suivi de l'utilisation d'un vérificateur de modèles efficace, puis d'un vérificateur de certificats pour certifier la sortie du vérificateur de modèles. La méthode privilégie la fiabilité de la certification : elle utilise le prouveur de théorèmes Isabelle/HOL pour vérifier formellement l'implémentation de l'encodage des automates temporisés, et utilise un vérificateur de certificats existant (également vérifié formellement dans Isabelle/HOL) pour certifier les résultats de la vérification de modèles.

Contexte de Recherche et Motivation

Problème Central

Le problème central abordé par cette recherche est la certification de l'insolvabilité des problèmes de planification temporelle. La planification temporelle est une forme riche de planification permettant aux actions d'avoir une durée et une exécution concurrente, beaucoup plus complexe que la planification classique.

Importance du Problème

Besoin de fiabilité : Les systèmes de planification existants sont extrêmement complexes aux niveaux algorithmique et d'implémentation, rendant crucial l'amélioration de la fiabilité de leurs résultats
Difficulté de certification : Contrairement aux problèmes solubles (vérifiables par exécution du plan), les affirmations d'insolvabilité ou d'optimalité sont difficiles à obtenir avec des certificats compacts
Complexité exponentielle : Dans le pire des cas, ces certificats peuvent croître exponentiellement par rapport à la taille de la tâche de planification

Limitations des Approches Existantes

Absence de garanties formelles : Les méthodes existantes de détection de l'insolvabilité en planification temporelle manquent de garanties formelles de correction
Complexité élevée : Les techniques algorithmiques les plus avancées en planification temporelle sont d'une grande complexité, rendant difficile la conception de schémas pratiques de certification de l'insolvabilité
Lacune de vérification : Comparé aux travaux de vérification formelle existants en planification classique, le domaine de la planification temporelle présente une lacune à cet égard

Motivation de la Recherche

Cet article adopte une approche de transformation par encodage : il encode les problèmes de planification temporelle en d'autres problèmes de calcul pour lesquels existent des algorithmes de certification pratiques (automates temporisés), et vérifie formellement l'ensemble du processus d'encodage et du vérificateur de certificats à l'aide d'un prouveur de théorèmes, garantissant la fiabilité de la certification.

Contributions Principales

Méthode d'encodage vérifiée formellement : Première vérification formelle de l'encodage de la planification temporelle en automates temporisés proposé par Heinz et al.
Implémentation d'ingénierie : Adaptation de l'encodage pour produire un format d'automates temporisés compatible avec le système de Wimmer et von Mutius
Conception de sémantique simplifiée : Conception d'une sémantique de planification temporelle plus simple que les travaux existants, facilitant le raisonnement mathématique, avec preuve d'équivalence avec la sémantique existante
Cadre de certification complet : Construction d'une chaîne de certification fiable complète, du problème de planification temporelle à la vérification de modèles d'automates temporisés
Garanties de correction théorique : Preuve de la correction de l'encodage dans Isabelle/HOL, fournissant des garanties théoriques solides

Détail de la Méthode

Définition de la Tâche

Entrée : Problème de planification temporelle P = ⟨P, A, I, G⟩

P : ensemble de propositions
A : ensemble d'actions de durée
I : état initial
G : conditions d'objectif

Sortie : Certificat formel d'insolvabilité (si le problème est effectivement insoluble)

Conditions de contrainte :

Les actions possèdent des actions instantanées de début et de fin
Support des conditions invariantes et des contraintes d'ordonnancement
Satisfaction des contraintes d'exclusion mutuelle et des limites de durée

Architecture du Modèle

1. Formalisation de la Planification Temporelle

L'article définit d'abord la sémantique formelle de la planification temporelle :

Actions instantanées (Définition 1) :

h ≡ ⟨pre(h), adds(h), dels(h)⟩

Actions de durée (Définition 2) :

a ≡ ⟨a⊢, a⊣, over_all(a), L(a), U(a)⟩

où a⊢ et a⊣ sont respectivement les actions instantanées de début et de fin.

2. Encodage en Automates Temporisés

Conception des variables (Définition 24) :

Pour chaque proposition p : variable binaire vp (encodant la valeur de vérité) et compteur de verrous lp (enregistrant le nombre d'actions actives nécessitant que p soit vrai)
aa : nombre total d'actions actives
ps : état de planification (0=non commencé, 1=en cours, 2=terminé)

Conception des horloges (Définition 25) :

Deux horloges allouées à chaque action a : ca⊢ (enregistrant le temps après le début) et ca⊣ (enregistrant le temps après la fin)

Automate principal (Définition 26) : Contrôle les transitions d'état du processus de planification global, incluant l'initialisation et la vérification d'objectif.

Automates d'action (Définition 27) : Chaque action correspond à un automate, contenant les transitions clés suivantes :

sea : application des effets du début d'action
se'a : verrouillage des conditions invariantes
eea : préparation avant la fin
ee'a : application des effets de fin d'action
iea : traitement des actions instantanées

3. Construction du Réseau

Combinaison de l'automate principal et de tous les automates d'action en un réseau d'automates temporisés (Définition 28), avec configuration initiale où tous les automates sont inactifs.

Points d'Innovation Technique

Support de l'exécution concurrente : Contrairement à Heinz et al. qui utilisent un verrou global, cet article utilise des contraintes d'horloge permettant l'exécution concurrente d'actions instantanées
Traitement des actions instantanées : Support des actions de durée zéro via l'ajout de transitions iea
Vérification formelle : Première preuve de correction vérifiée par machine pour ce type d'encodage
Simplification sémantique : Conception d'une sémantique de planification temporelle plus adaptée au raisonnement formel

Configuration Expérimentale

Environnement de Vérification Formelle

Prouveur de théorèmes : Isabelle/HOL
Vérificateur de certificats : Vérificateur de certificats vérifié de Wimmer et von Mutius
Propriété cible : Vérification d'accessibilité A ⊨ EF(loc(AM) = goal)

Statistiques de Taille du Code

Composant	Nombre de lignes
Formalisation de la sémantique abstraite de planification temporelle	~7 200
Définition du réseau d'automates temporisés utilisant Munta	~800
Preuve du Théorème 1 et lemmes associés	~8 500
Lemmes relatifs aux listes	~1 500
Total	~18 000

Comparaison avec les Travaux Connexes

Comparaison de taille avec les travaux de vérification formelle connexes :

Planificateur basé sur SAT vérifié : ~17 500 lignes
Vérificateur de planification classique vérifié : ~3 000 lignes
Vérificateur de planification temporelle PDDL vérifié : ~6 500 lignes

Résultats Expérimentaux

Résultats Théoriques Principaux

Théorème 1 (Théorème de Correction Principal) : Si le plan π est valide et sans auto-chevauchement (valid(π) ∧ no_self_overlap(π)), alors l'assertion A ⊨ EF(loc(AM) = goal) est vérifiée.

Structure de la Preuve :

Lemme 1 : Construction d'une exécution simulant un plan parallèle induit
Lemme 2 : Accessibilité de la configuration encodée depuis la configuration initiale
Lemme 3 : Transition de l'état final à la configuration d'objectif

Résultats de Vérification Formelle

Preuve de complétude : Preuve réussie de la complétude de l'encodage, c'est-à-dire que chaque plan valide trouve une exécution valide dans le réseau d'automates temporisés correspondant
Vérification par machine : Toutes les preuves sont vérifiées par machine dans Isabelle/HOL, fournissant le plus haut niveau de garantie de fiabilité
Conception modulaire : Structure de preuve modulaire, facilitant la compréhension et la maintenance

Vérification de l'Implémentation d'Ingénierie

L'implémentation de l'encodage a été adaptée au format compatible avec le vérificateur de certificats vérifié existant, formant une chaîne de certification complète et exécutable.

Travaux Connexes

Certification en Planification Classique

Eriksson et al. ont conçu des schémas compacts de certification de l'insolvabilité pour la planification classique
Abdulaziz et Lammich ont fourni un vérificateur formel pour la planification classique

Planification Temporelle et Vérification de Modèles

Dierks et al. ont implémenté une réduction statique d'un sous-ensemble PDDL en automates temporisés
Heinz et al. ont défini un encodage explicite des problèmes de planification temporelle en automates temporisés
Gigante et al. ont étudié théoriquement la complexité de la planification temporelle

Méthodes de Vérification Formelle

Abdulaziz et Kurz ont utilisé une approche similaire pour développer un système de planification basé sur SAT certifié
Kumar et al. et Leroy ont utilisé la vérification progressive d'encodages dans la vérification de compilateurs

Conclusion et Discussion

Conclusions Principales

Vérification de faisabilité : Démonstration que la certification formelle de l'insolvabilité en planification temporelle est faisable
Garanties théoriques : Fournit des garanties de correction solides via le prouveur de théorèmes
Implémentation d'ingénierie : Construction réussie d'une chaîne d'outils de certification complète

Limitations

Restrictions d'entrée : Accepte actuellement uniquement les problèmes de planification temporelle déjà instanciés
Sous-ensemble sémantique : La sémantique supportée est un sous-ensemble du vérificateur de planification vérifié existant
Exécutabilité : Le mécanisme de certification n'est pas encore complètement exécutable

Directions Futures

Preuve d'équivalence : Prévoit de prouver formellement l'équivalence entre la sémantique de cet article et celle des vérificateurs existants
Implémentation exécutable : Développement d'un vérificateur de certificats exécutable
Vérification d'instanciation : Vérification formelle des algorithmes d'instanciation, comme le solveur Datalog de Helmert
Relâchement de contraintes : Étude de la possibilité de relâcher la condition d'absence d'auto-chevauchement

Évaluation Approfondie

Points Forts

Rigueur théorique : Première preuve formelle vérifiée par machine de la certification de l'insolvabilité en planification temporelle
Complétude d'ingénierie : Non seulement un cadre théorique, mais aussi une intégration avec les outils existants
Innovation méthodologique :
- Conception d'encodage supportant l'exécution concurrente
- Solution élégante pour le traitement des actions instantanées
- Conception de sémantique simplifiée mais équivalente
Garanties de fiabilité : Fournit le plus haut niveau de garantie de correction via le prouveur de théorèmes

Insuffisances

Limitations de praticité :
- Nécessite une entrée préalablement instanciée
- Pas encore complètement exécutable
- Absence d'évaluation de performance
Couverture limitée : Supporte uniquement un sous-ensemble de la planification temporelle, ne couvre pas les caractéristiques complètes de PDDL
Scalabilité : L'ampleur du travail de vérification formelle (18 000 lignes de code) est relativement importante, avec des coûts de maintenance élevés

Impact

Contribution académique :
- Comble le vide en vérification formelle de la planification temporelle
- Fournit une nouvelle base théorique pour la certification de l'insolvabilité
- Démontre la faisabilité de la vérification formelle de systèmes complexes
Valeur pratique :
- Fournit une certification fiable des systèmes de planification pour les applications critiques
- Extensible à d'autres formes de planification et problèmes de satisfaction de contraintes
- Fournit une référence pour le développement d'outils de vérification automatisée
Reproductibilité : Basé sur Isabelle/HOL open-source, théoriquement complètement reproductible

Scénarios d'Application

Systèmes critiques : Applications de planification nécessitant des garanties de haute fiabilité (aérospatiale, dispositifs médicaux)
Outils de recherche : Fournit une infrastructure de vérification formelle pour la recherche en planification temporelle
Utilisation éducative : Cas d'étude pour l'enseignement des méthodes formelles et des algorithmes de planification
Développement d'outils : Fournit une base théorique pour le développement d'outils de planification fiables

Références

Les références clés incluent :

Abdulaziz & Koller (2022) : Sémantique formelle et vérificateur pour la planification temporelle
Heinz et al. (2019) : Encodage de la planification temporelle en automates temporisés
Wimmer & von Mutius (2020) : Vérificateur de certificats pour automates temporisés
Abdulaziz & Kurz (2023) : Système de planification basé sur SAT certifié

Cet article apporte une contribution importante au domaine de la vérification formelle de la planification temporelle. Bien qu'il y ait encore place à amélioration en termes de praticité, sa rigueur théorique et son innovation méthodologique jettent une base solide pour le développement futur du domaine.