2025-11-15T12:40:11.869613

Formally Verified Certification of Unsolvability of Temporal Planning Problems

Wang, Abdulaziz

We present an approach to unsolvability certification of temporal planning. Our approach is based on encoding the planning problem into a network of timed automata, and then using an efficient model checker on the network followed by a certificate checker to certify the output of the model checker. Our approach prioritises trustworthiness of the certification: we formally verify our implementation of the encoding to timed automata using the theorem prover Isabelle/HOL and we use an existing certificate checker (also formally verified in Isabelle/HOL) to certify the model checking result.

academic

시간 규획 문제의 불가해성에 대한 형식 검증 인증

기본 정보

논문 ID: 2510.10189
제목: Formally Verified Certification of Unsolvability of Temporal Planning Problems
저자: David Wang, Mohammad Abdulaziz (King's College London, United Kingdom)
분류: cs.LO (컴퓨터 과학의 논리), cs.AI (인공지능)
발표 시간: 2025년 10월 11일 (arXiv 사전인쇄본)
논문 링크: https://arxiv.org/abs/2510.10189

초록

본 논문은 시간 규획 문제의 불가해성 인증을 위한 방법을 제시한다. 이 방법은 규획 문제를 시간 자동기계 네트워크로 인코딩한 후, 네트워크에서 효율적인 모델 검사기를 사용하고, 이어서 인증서 검사기를 사용하여 모델 검사기의 출력을 인증하는 방식에 기반한다. 이 방법은 인증의 신뢰성을 우선시한다: 정리 증명기 Isabelle/HOL을 사용하여 시간 자동기계 인코딩의 구현을 형식 검증하고, 기존의 인증서 검사기(역시 Isabelle/HOL에서 형식 검증됨)를 사용하여 모델 검사 결과를 인증한다.

연구 배경 및 동기

핵심 문제

본 연구가 해결하고자 하는 핵심 문제는 시간 규획 문제의 불가해성 인증이다. 시간 규획은 동작이 지속 시간을 가지며 동시 실행이 가능한 풍부한 규획 형식으로, 고전 규획에 비해 훨씬 복잡하다.

문제의 중요성

신뢰성 요구: 기존 규획 시스템은 알고리즘 및 구현 수준에서 극도로 복잡하므로, 그 출력의 신뢰성을 높이는 것이 매우 중요하다
인증의 어려움: 가해 문제와 달리(계획 실행으로 검증 가능), 불가해성 또는 최적성 주장은 간결한 인증서를 얻기 어렵다
지수 복잡도: 최악의 경우, 이러한 인증서는 규획 작업 크기에 대해 지수적으로 증가할 수 있다

기존 방법의 한계

형식 보장 부족: 기존의 시간 규획 불가해성 탐지 방법은 형식적 정확성 보장이 부족하다
높은 복잡성: 최첨단 시간 규획 알고리즘 기술은 복잡도가 높아 실용적인 불가해성 인증 방안을 직접 설계하기 어렵다
검증 공백: 고전 규획에서 이루어진 형식 검증 작업에 비해, 시간 규획 분야에서는 이 분야에 공백이 있다

연구 동기

본 논문은 인코딩 변환 방법을 채택한다: 시간 규획 문제를 이미 실용적인 인증 알고리즘이 있는 다른 계산 문제(시간 자동기계)로 인코딩하고, 정리 증명기를 통해 전체 인코딩 과정과 인증서 검사기를 형식 검증하여 인증의 신뢰성을 보장한다.

핵심 기여

형식 검증된 인코딩 방법: Heinz 등의 시간 규획에서 시간 자동기계로의 인코딩을 처음으로 형식 검증
공학적 구현: Wimmer와 von Mutius 시스템과 호환되는 시간 자동기계 형식을 생성하도록 인코딩 적응
단순화된 의미론 설계: 기존 작업보다 더 간단한 시간 규획 의미론을 설계하여 수학적 추론을 용이하게 하고, 기존 의미론과의 동등성을 증명
완전한 인증 프레임워크: 시간 규획 문제에서 시간 자동기계 모델 검사까지의 완전한 신뢰 가능한 인증 체인 구축
이론적 정확성 보장: Isabelle/HOL에서 인코딩의 정확성을 증명하여 강력한 이론적 보장 제공

방법 상세 설명

작업 정의

입력: 시간 규획 문제 P = ⟨P, A, I, G⟩

P: 명제 집합
A: 지속 동작 집합
I: 초기 상태
G: 목표 조건

출력: 불가해성의 형식 인증서(문제가 실제로 불가해한 경우)

제약 조건:

동작은 시작 및 종료 스냅샷 동작을 가짐
불변 조건 및 스케줄링 제약 지원
상호 배제 제약 및 지속 시간 경계 만족

모델 아키텍처

1. 시간 규획 형식화

논문은 먼저 시간 규획의 형식 의미론을 정의한다:

스냅샷 동작(정의 1):

h ≡ ⟨pre(h), adds(h), dels(h)⟩

지속 동작(정의 2):

a ≡ ⟨a⊢, a⊣, over_all(a), L(a), U(a)⟩

여기서 a⊢와 a⊣는 각각 시작 및 종료 스냅샷 동작이다.

2. 시간 자동기계 인코딩

변수 설계(정의 24):

각 명제 p에 대해: 이진 변수 vp(진리값 인코딩) 및 잠금 카운터 lp(p가 참이어야 하는 활성 동작 수 기록)
aa: 활성 동작의 총 수
ps: 규획 상태(0=미시작, 1=규획 중, 2=완료)

시계 설계(정의 25):

각 동작 a에 두 개의 시계 할당: ca⊢(시작 후 시간 기록) 및 ca⊣(종료 후 시간 기록)

주 자동기계(정의 26): 전체 규획 과정의 상태 전이를 제어하며, 초기화 및 목표 검사를 포함한다.

동작 자동기계(정의 27): 각 동작에 대응하는 자동기계로, 다음의 주요 전이를 포함한다:

sea: 동작 시작의 효과 적용
se'a: 불변 조건 잠금
eea: 종료 전 준비
ee'a: 동작 종료의 효과 적용
iea: 순간 동작 처리

3. 네트워크 구축

주 자동기계와 모든 동작 자동기계를 시간 자동기계 네트워크로 결합(정의 28)하며, 초기 구성은 모든 자동기계를 비활성 상태로 설정한다.

기술 혁신 포인트

동시 실행 지원: Heinz 등이 전역 잠금을 사용하는 것과 달리, 본 논문은 시계 제약을 사용하여 동시 스냅샷 동작 실행을 허용
순간 동작 처리: iea 전이 추가를 통해 영 지속 시간의 순간 동작 지원
형식 검증: 처음으로 이러한 유형의 인코딩에 대한 기계 검사 정확성 증명 제공
의미론 단순화: 형식 추론에 더 적합한 시간 규획 의미론 설계

실험 설정

형식 검증 환경

정리 증명기: Isabelle/HOL
인증서 검사기: Wimmer와 von Mutius의 검증된 인증서 검사기
목표 성질: 도달 가능성 검사 A ⊨ EF(loc(AM) = goal)

코드 규모 통계

구성 요소	코드 줄 수
추상 시간 규획 의미론 형식화	~7,200
Munta를 사용한 시간 자동기계 네트워크 정의	~800
정리 1 및 관련 보조정리의 증명	~8,500
리스트 관련 보조정리	~1,500
합계	~18,000

비교 기준

관련 형식 검증 작업의 규모 비교:

검증된 SAT 기반 규획기: ~17,500줄
검증된 고전 규획 검증기: ~3,000줄
검증된 시간 PDDL 규획 검증기: ~6,500줄

실험 결과

주요 이론 결과

정리 1(주요 정확성 정리): 계획 π가 유효하고 자기 중복이 없으면(valid(π) ∧ no_self_overlap(π)), 단언 A ⊨ EF(loc(AM) = goal)이 성립한다.

증명 구조:

보조정리 1: 병렬 계획 실행을 시뮬레이트하는 실행 구축
보조정리 2: 초기 구성에서 인코딩된 상태로의 도달 가능성
보조정리 3: 최종 상태에서 목표 구성으로의 전이

형식 검증 성과

완전성 증명: 인코딩의 완전성을 성공적으로 증명하여, 모든 유효한 계획이 대응하는 시간 자동기계 네트워크에서 유효한 실행을 찾을 수 있음을 보임
기계 검사: 모든 증명이 Isabelle/HOL의 기계 검사를 통과하여 최고 수준의 신뢰성 보장 제공
모듈식 설계: 증명 구조가 모듈식이어서 이해 및 유지보수가 용이함

공학적 구현 검증

인코딩 구현이 기존 검증된 인증서 검사기와 호환되는 형식으로 적응되어 완전한 실행 가능한 인증 체인을 형성한다.

결론 및 논의

주요 결론

가능성 검증: 시간 규획 불가해성의 형식 인증이 가능함을 증명
이론적 보장: 정리 증명기를 통해 강력한 정확성 보장 제공
공학적 구현: 완전한 인증 도구 체인 성공적 구축

한계

입력 제한: 현재 이미 인스턴스화된 시간 규획 문제만 수용
의미론 부분집합: 지원되는 의미론은 검증된 규획 검증기의 부분집합
실행 가능성: 인증 메커니즘이 아직 완전히 실행 가능하지 않음

향후 방향

동등성 증명: 본 논문의 의미론과 기존 검증기 의미론의 동등성을 형식 증명할 계획
실행 가능한 구현: 실행 가능한 인증서 검사기 개발
인스턴스화 검증: Helmert의 데이터로그 솔버와 같은 인스턴스화 알고리즘의 형식 검증
제약 완화: 자기 중복 없음 조건 완화의 가능성 연구

심층 평가

장점

이론적 엄밀성: 시간 규획 불가해성 인증에 대한 기계 검사 형식 증명을 처음으로 제공
공학적 완전성: 이론 프레임워크뿐만 아니라 기존 도구와의 통합도 구현
방법 혁신성:
- 동시 실행을 지원하는 인코딩 설계
- 순간 동작 처리의 우아한 솔루션
- 단순화되고 동등한 의미론 설계
신뢰성 보장: 정리 증명기를 통해 최고 수준의 정확성 보장 제공

부족한 점

실용성 제한:
- 사전 인스턴스화된 입력 필요
- 아직 완전히 실행 가능하지 않음
- 성능 평가 부재
커버리지 범위: 시간 규획의 부분집합만 지원하며, 완전한 PDDL 기능 미지원
확장성: 18,000줄의 형식 검증 작업 규모가 크므로 유지보수 비용이 높음

영향력

학술적 기여:
- 시간 규획 형식 검증의 공백 해소
- 불가해성 인증에 대한 새로운 이론적 기초 제공
- 복잡한 시스템의 형식 검증 가능성 시연
실용적 가치:
- 중요 응용 분야에서 신뢰할 수 있는 규획 시스템 인증 제공
- 다른 규획 형식 및 제약 만족 문제로 확장 가능
- 자동화 검증 도구 개발에 참고 자료 제공
재현성: 오픈소스 Isabelle/HOL을 기반으로 하므로 이론적으로 완전히 재현 가능

적용 시나리오

중요 시스템: 높은 신뢰성 보장이 필요한 규획 응용(항공우주, 의료기기 등)
연구 도구: 시간 규획 연구를 위한 형식 검증 기초 시설 제공
교육 용도: 형식 방법 및 규획 알고리즘 교육의 사례로 활용
도구 개발: 신뢰할 수 있는 규획 도구 개발을 위한 이론적 기초 제공

참고문헌

주요 참고문헌:

Abdulaziz & Koller (2022): 시간 규획의 형식 의미론 및 검증기
Heinz et al. (2019): 시간 규획에서 시간 자동기계로의 인코딩
Wimmer & von Mutius (2020): 시간 자동기계의 검증된 인증서 검사기
Abdulaziz & Kurz (2023): 검증된 SAT 기반 규획 시스템

이 논문은 시간 규획의 형식 검증 분야에서 중요한 기여를 하였으며, 실용성 측면에서 개선할 여지가 있지만, 이론적 엄밀성과 방법 혁신성은 해당 분야의 발전을 위한 견고한 기초를 마련하였다.