2025-11-15T12:40:11.869613

Formally Verified Certification of Unsolvability of Temporal Planning Problems

Wang, Abdulaziz
We present an approach to unsolvability certification of temporal planning. Our approach is based on encoding the planning problem into a network of timed automata, and then using an efficient model checker on the network followed by a certificate checker to certify the output of the model checker. Our approach prioritises trustworthiness of the certification: we formally verify our implementation of the encoding to timed automata using the theorem prover Isabelle/HOL and we use an existing certificate checker (also formally verified in Isabelle/HOL) to certify the model checking result.
academic

Certificazione Formalmente Verificata dell'Insolubilità dei Problemi di Pianificazione Temporale

Informazioni Fondamentali

  • ID Articolo: 2510.10189
  • Titolo: Formally Verified Certification of Unsolvability of Temporal Planning Problems
  • Autori: David Wang, Mohammad Abdulaziz (King's College London, Regno Unito)
  • Classificazione: cs.LO (Logica in Informatica), cs.AI (Intelligenza Artificiale)
  • Data di Pubblicazione: 11 ottobre 2025 (preprint arXiv)
  • Link Articolo: https://arxiv.org/abs/2510.10189

Riassunto

L'articolo propone un metodo per la certificazione dell'insolubilità dei problemi di pianificazione temporale. Il metodo si basa sulla codifica dei problemi di pianificazione come reti di automi temporali, seguita dall'applicazione di efficienti model checker sulla rete e dall'utilizzo di verificatori di certificati per autenticare l'output del model checker. Il metodo privilegia l'affidabilità della certificazione: utilizza il dimostratore di teoremi Isabelle/HOL per la verifica formale dell'implementazione della codifica degli automi temporali e impiega un verificatore di certificati esistente (anch'esso formalmente verificato in Isabelle/HOL) per autenticare i risultati del model checking.

Contesto di Ricerca e Motivazione

Problema Centrale

Il problema centrale affrontato da questa ricerca è la certificazione dell'insolubilità dei problemi di pianificazione temporale. La pianificazione temporale è una forma di pianificazione più ricca che consente alle azioni di avere durata e di essere eseguite concorrentemente, risultando più complessa della pianificazione classica.

Importanza del Problema

  1. Esigenza di Affidabilità: I sistemi di pianificazione esistenti sono estremamente complessi sia a livello algoritmico che implementativo, rendendo cruciale aumentare l'affidabilità dei loro output
  2. Difficoltà di Certificazione: A differenza dei problemi risolvibili (verificabili mediante l'esecuzione di un piano), le affermazioni di insolubilità o optimalità sono difficili da certificare in modo compatto
  3. Complessità Esponenziale: Nel caso peggiore, tali certificati possono crescere esponenzialmente rispetto alla dimensione del compito di pianificazione

Limitazioni dei Metodi Esistenti

  1. Mancanza di Garanzie Formali: I metodi esistenti per il rilevamento dell'insolubilità nella pianificazione temporale mancano di garanzie di correttezza formale
  2. Alta Complessità: Le tecniche algoritmiche più avanzate nella pianificazione temporale hanno un'elevata complessità, rendendo difficile progettare schemi pratici di certificazione dell'insolubilità
  3. Lacuna nella Verifica: Rispetto al lavoro di verifica formale già disponibile nella pianificazione classica, il campo della pianificazione temporale presenta una lacuna significativa

Motivazione della Ricerca

L'articolo adotta un approccio di trasformazione mediante codifica: codifica i problemi di pianificazione temporale in altri problemi computazionali per i quali esistono algoritmi di certificazione pratici (automi temporali), e verifica formalmente mediante dimostratore di teoremi l'intero processo di codifica e il verificatore di certificati, garantendo l'affidabilità della certificazione.

Contributi Fondamentali

  1. Metodo di Codifica Formalmente Verificato: Prima verifica formale della codifica da pianificazione temporale ad automi temporali proposta da Heinz et al.
  2. Implementazione Ingegneristica: Adattamento della codifica per produrre formati di automi temporali compatibili con il sistema di Wimmer e von Mutius
  3. Progettazione di Semantica Semplificata: Progettazione di una semantica della pianificazione temporale più semplice rispetto ai lavori esistenti, facilitando il ragionamento matematico, con dimostrazione di equivalenza rispetto alle semantiche esistenti
  4. Framework di Certificazione Completo: Costruzione di una catena di certificazione affidabile completa dai problemi di pianificazione temporale al model checking degli automi temporali
  5. Garanzie di Correttezza Teorica: Dimostrazione della correttezza della codifica in Isabelle/HOL, fornendo garanzie teoriche robuste

Spiegazione Dettagliata del Metodo

Definizione del Compito

Input: Problema di pianificazione temporale P = ⟨P, A, I, G⟩

  • P: insieme di proposizioni
  • A: insieme di azioni con durata
  • I: stato iniziale
  • G: condizioni di obiettivo

Output: Certificato formale di insolubilità (se il problema è effettivamente insolubile)

Vincoli:

  • Le azioni possiedono azioni snapshot di inizio e fine
  • Supporto per condizioni invarianti e vincoli di scheduling
  • Soddisfacimento di vincoli di mutua esclusione e limiti di durata

Architettura del Modello

1. Formalizzazione della Pianificazione Temporale

L'articolo definisce innanzitutto la semantica formale della pianificazione temporale:

Azioni Snapshot (Definizione 1):

h ≡ ⟨pre(h), adds(h), dels(h)⟩

Azioni con Durata (Definizione 2):

a ≡ ⟨a⊢, a⊣, over_all(a), L(a), U(a)⟩

dove a⊢ e a⊣ sono rispettivamente le azioni snapshot di inizio e fine.

2. Codifica degli Automi Temporali

Progettazione delle Variabili (Definizione 24):

  • Per ogni proposizione p: variabile binaria vp (codifica il valore di verità) e contatore di lock lp (registra il numero di azioni attive che richiedono p come vera)
  • aa: registra il numero totale di azioni attive
  • ps: stato di pianificazione (0=non iniziato, 1=in corso, 2=completato)

Progettazione dei Clock (Definizione 25):

  • Per ogni azione a sono assegnati due clock: ca⊢ (registra il tempo dopo l'inizio) e ca⊣ (registra il tempo dopo la fine)

Automa Principale (Definizione 26): Controlla le transizioni di stato dell'intero processo di pianificazione, inclusa l'inizializzazione e il controllo dell'obiettivo.

Automi di Azione (Definizione 27): Ogni azione corrisponde a un automa, contenente le seguenti transizioni chiave:

  • sea: applicazione degli effetti dell'azione di inizio
  • se'a: blocco delle condizioni invarianti
  • eea: preparazione prima della fine
  • ee'a: applicazione degli effetti dell'azione di fine
  • iea: gestione delle azioni istantanee

3. Costruzione della Rete

Combinazione dell'automa principale e di tutti gli automi di azione in una rete di automi temporali (Definizione 28), con configurazione iniziale che imposta tutti gli automi in stato inattivo.

Punti di Innovazione Tecnica

  1. Supporto per Esecuzione Concorrente: A differenza di Heinz et al. che utilizzano lock globali, questo articolo utilizza vincoli di clock per consentire l'esecuzione concorrente di azioni snapshot
  2. Gestione di Azioni Istantanee: Supporto per azioni a durata zero mediante l'aggiunta di transizioni iea
  3. Verifica Formale: Prima fornitura di dimostrazione di correttezza controllata da macchina per questo tipo di codifica
  4. Semplificazione della Semantica: Progettazione di una semantica della pianificazione temporale più adatta al ragionamento formale

Configurazione Sperimentale

Ambiente di Verifica Formale

  • Dimostratore di Teoremi: Isabelle/HOL
  • Verificatore di Certificati: Verificatore di certificati formalmente verificato di Wimmer e von Mutius
  • Proprietà Obiettivo: Verifica di raggiungibilità A ⊨ EF(loc(AM) = goal)

Statistiche sulla Dimensione del Codice

ComponenteRighe di Codice
Formalizzazione della semantica astratta della pianificazione temporale~7.200
Definizione della rete di automi temporali utilizzando Munta~800
Dimostrazione del Teorema 1 e lemmi correlati~8.500
Lemmi correlati a liste~1.500
Totale~18.000

Benchmark di Confronto

Confronto della dimensione con lavori di verifica formale correlati:

  • Pianificatore basato su SAT verificato: ~17.500 righe
  • Verificatore di pianificazione classica verificato: ~3.000 righe
  • Verificatore di pianificazione temporale PDDL verificato: ~6.500 righe

Risultati Sperimentali

Risultati Teorici Principali

Teorema 1 (Teorema Principale di Correttezza): Se il piano π è valido e privo di auto-sovrapposizioni (valid(π) ∧ no_self_overlap(π)), allora l'asserzione A ⊨ EF(loc(AM) = goal) è valida.

Struttura della Dimostrazione:

  1. Lemma 1: Costruzione di una simulazione che induce un'esecuzione del piano parallelo
  2. Lemma 2: Raggiungibilità dalla configurazione iniziale allo stato codificato
  3. Lemma 3: Transizione dallo stato finale alla configurazione obiettivo

Risultati della Verifica Formale

  1. Dimostrazione di Completezza: Dimostrazione riuscita della completezza della codifica, ovvero ogni piano valido può trovare un'esecuzione valida nella corrispondente rete di automi temporali
  2. Controllo da Macchina: Tutte le dimostrazioni sono state controllate dalla macchina tramite Isabelle/HOL, fornendo il massimo livello di garanzia di affidabilità
  3. Progettazione Modulare: La struttura della dimostrazione è modulare, facilitando la comprensione e la manutenzione

Verifica dell'Implementazione Ingegneristica

L'implementazione della codifica è stata adattata al formato compatibile con il verificatore di certificati verificato esistente, formando una catena di certificazione completa ed eseguibile.

Lavori Correlati

Certificazione della Pianificazione Classica

  • Eriksson et al. hanno progettato schemi compatti di certificazione dell'insolubilità per la pianificazione classica
  • Abdulaziz e Lammich hanno fornito un verificatore formale per la pianificazione classica

Pianificazione Temporale e Model Checking

  • Dierks et al. hanno implementato una riduzione statica di sottoinsiemi PDDL ad automi temporali
  • Heinz et al. hanno definito una codifica esplicita da problemi di pianificazione temporale ad automi temporali
  • Gigante et al. hanno studiato a livello teorico la complessità della pianificazione temporale

Metodi di Verifica Formale

  • Abdulaziz e Kurz hanno utilizzato un approccio simile per sviluppare un sistema di pianificazione basato su SAT certificato
  • Kumar et al. e Leroy hanno utilizzato il metodo della verifica graduale della codifica nella verifica dei compilatori

Conclusioni e Discussione

Conclusioni Principali

  1. Verifica di Fattibilità: Dimostrazione della fattibilità della certificazione formale dell'insolubilità della pianificazione temporale
  2. Garanzie Teoriche: Fornitura di garanzie di correttezza robuste tramite dimostratore di teoremi
  3. Implementazione Ingegneristica: Costruzione riuscita di una catena di strumenti di certificazione completa

Limitazioni

  1. Restrizioni di Input: Attualmente accetta solo problemi di pianificazione temporale già istanziati come input
  2. Sottoinsieme Semantico: La semantica supportata è un sottoinsieme di quella dei verificatori di pianificazione già verificati
  3. Eseguibilità: Il meccanismo di certificazione non è ancora completamente reso eseguibile

Direzioni Future

  1. Dimostrazione di Equivalenza: Pianificazione della dimostrazione formale dell'equivalenza tra la semantica di questo articolo e quella dei verificatori esistenti
  2. Implementazione Eseguibile: Sviluppo di un verificatore di certificati eseguibile
  3. Verifica dell'Istanziazione: Verifica formale degli algoritmi di istanziazione, come il risolutore di data log di Helmert
  4. Rilassamento dei Vincoli: Ricerca della possibilità di rilassare la condizione di assenza di auto-sovrapposizioni

Valutazione Approfondita

Punti di Forza

  1. Rigore Teorico: Prima fornitura di dimostrazione formale controllata da macchina per la certificazione dell'insolubilità della pianificazione temporale
  2. Completezza Ingegneristica: Non solo fornisce un framework teorico, ma realizza anche l'integrazione con gli strumenti esistenti
  3. Innovazione Metodologica:
    • Progettazione della codifica che supporta l'esecuzione concorrente
    • Soluzione elegante per la gestione delle azioni istantanee
    • Progettazione di semantica semplificata ma equivalente
  4. Garanzie di Affidabilità: Fornitura del massimo livello di garanzie di correttezza tramite dimostratore di teoremi

Insufficienze

  1. Limitazioni di Praticità:
    • Richiede input pre-istanziati
    • Non ancora completamente eseguibile
    • Mancanza di valutazione delle prestazioni
  2. Copertura: Supporta solo un sottoinsieme della pianificazione temporale, non supporta le caratteristiche complete di PDDL
  3. Scalabilità: La scala del lavoro di verifica formale di 18.000 righe di codice è relativamente grande, con elevati costi di manutenzione

Impatto

  1. Contributo Accademico:
    • Colma la lacuna nella verifica formale della pianificazione temporale
    • Fornisce una nuova base teorica per la certificazione dell'insolubilità
    • Dimostra la fattibilità della verifica formale di sistemi complessi
  2. Valore Pratico:
    • Fornisce certificazione affidabile di sistemi di pianificazione per applicazioni critiche
    • Estendibile ad altre forme di pianificazione e problemi di soddisfacimento di vincoli
    • Fornisce riferimento per lo sviluppo di strumenti di verifica automatizzata
  3. Riproducibilità: Basato su Isabelle/HOL open source, teoricamente completamente riproducibile

Scenari Applicabili

  1. Sistemi Critici: Applicazioni di pianificazione che richiedono garanzie di affidabilità elevate (come aerospaziale, dispositivi medici)
  2. Strumenti di Ricerca: Fornitura di infrastruttura di verifica formale per la ricerca sulla pianificazione temporale
  3. Uso Educativo: Come caso di studio per l'insegnamento di metodi formali e algoritmi di pianificazione
  4. Sviluppo di Strumenti: Fornitura di base teorica per lo sviluppo di strumenti di pianificazione affidabili

Bibliografia

Le referenze chiave includono:

  • Abdulaziz & Koller (2022): Semantica formale e verificatore per la pianificazione temporale
  • Heinz et al. (2019): Codifica da pianificazione temporale ad automi temporali
  • Wimmer & von Mutius (2020): Verificatore di certificati formalmente verificato per automi temporali
  • Abdulaziz & Kurz (2023): Sistema di pianificazione basato su SAT verificato

Questo articolo fornisce un contributo importante nel campo della verifica formale della pianificazione temporale. Sebbene vi sia ancora spazio per miglioramenti in termini di praticità, il suo rigore teorico e l'innovazione metodologica pongono una base solida per lo sviluppo futuro del campo.