We present an approach to unsolvability certification of temporal planning. Our approach is based on encoding the planning problem into a network of timed automata, and then using an efficient model checker on the network followed by a certificate checker to certify the output of the model checker. Our approach prioritises trustworthiness of the certification: we formally verify our implementation of the encoding to timed automata using the theorem prover Isabelle/HOL and we use an existing certificate checker (also formally verified in Isabelle/HOL) to certify the model checking result.
논문 ID : 2510.10189제목 : Formally Verified Certification of Unsolvability of Temporal Planning Problems저자 : David Wang, Mohammad Abdulaziz (King's College London, United Kingdom)분류 : cs.LO (컴퓨터 과학의 논리), cs.AI (인공지능)발표 시간 : 2025년 10월 11일 (arXiv 사전인쇄본)논문 링크 : https://arxiv.org/abs/2510.10189 본 논문은 시간 규획 문제의 불가해성 인증을 위한 방법을 제시한다. 이 방법은 규획 문제를 시간 자동기계 네트워크로 인코딩한 후, 네트워크에서 효율적인 모델 검사기를 사용하고, 이어서 인증서 검사기를 사용하여 모델 검사기의 출력을 인증하는 방식에 기반한다. 이 방법은 인증의 신뢰성을 우선시한다: 정리 증명기 Isabelle/HOL을 사용하여 시간 자동기계 인코딩의 구현을 형식 검증하고, 기존의 인증서 검사기(역시 Isabelle/HOL에서 형식 검증됨)를 사용하여 모델 검사 결과를 인증한다.
본 연구가 해결하고자 하는 핵심 문제는 시간 규획 문제의 불가해성 인증 이다. 시간 규획은 동작이 지속 시간을 가지며 동시 실행이 가능한 풍부한 규획 형식으로, 고전 규획에 비해 훨씬 복잡하다.
신뢰성 요구 : 기존 규획 시스템은 알고리즘 및 구현 수준에서 극도로 복잡하므로, 그 출력의 신뢰성을 높이는 것이 매우 중요하다인증의 어려움 : 가해 문제와 달리(계획 실행으로 검증 가능), 불가해성 또는 최적성 주장은 간결한 인증서를 얻기 어렵다지수 복잡도 : 최악의 경우, 이러한 인증서는 규획 작업 크기에 대해 지수적으로 증가할 수 있다형식 보장 부족 : 기존의 시간 규획 불가해성 탐지 방법은 형식적 정확성 보장이 부족하다높은 복잡성 : 최첨단 시간 규획 알고리즘 기술은 복잡도가 높아 실용적인 불가해성 인증 방안을 직접 설계하기 어렵다검증 공백 : 고전 규획에서 이루어진 형식 검증 작업에 비해, 시간 규획 분야에서는 이 분야에 공백이 있다본 논문은 인코딩 변환 방법을 채택한다: 시간 규획 문제를 이미 실용적인 인증 알고리즘이 있는 다른 계산 문제(시간 자동기계)로 인코딩하고, 정리 증명기를 통해 전체 인코딩 과정과 인증서 검사기를 형식 검증하여 인증의 신뢰성을 보장한다.
형식 검증된 인코딩 방법 : Heinz 등의 시간 규획에서 시간 자동기계로의 인코딩을 처음으로 형식 검증공학적 구현 : Wimmer와 von Mutius 시스템과 호환되는 시간 자동기계 형식을 생성하도록 인코딩 적응단순화된 의미론 설계 : 기존 작업보다 더 간단한 시간 규획 의미론을 설계하여 수학적 추론을 용이하게 하고, 기존 의미론과의 동등성을 증명완전한 인증 프레임워크 : 시간 규획 문제에서 시간 자동기계 모델 검사까지의 완전한 신뢰 가능한 인증 체인 구축이론적 정확성 보장 : Isabelle/HOL에서 인코딩의 정확성을 증명하여 강력한 이론적 보장 제공입력 : 시간 규획 문제 P = ⟨P, A, I, G⟩
P: 명제 집합 A: 지속 동작 집합 I: 초기 상태 G: 목표 조건 출력 : 불가해성의 형식 인증서(문제가 실제로 불가해한 경우)
제약 조건 :
동작은 시작 및 종료 스냅샷 동작을 가짐 불변 조건 및 스케줄링 제약 지원 상호 배제 제약 및 지속 시간 경계 만족 논문은 먼저 시간 규획의 형식 의미론을 정의한다:
스냅샷 동작 (정의 1):
h ≡ ⟨pre(h), adds(h), dels(h)⟩
지속 동작 (정의 2):
a ≡ ⟨a⊢, a⊣, over_all(a), L(a), U(a)⟩
여기서 a⊢와 a⊣는 각각 시작 및 종료 스냅샷 동작이다.
변수 설계 (정의 24):
각 명제 p에 대해: 이진 변수 vp(진리값 인코딩) 및 잠금 카운터 lp(p가 참이어야 하는 활성 동작 수 기록) aa: 활성 동작의 총 수 ps: 규획 상태(0=미시작, 1=규획 중, 2=완료) 시계 설계 (정의 25):
각 동작 a에 두 개의 시계 할당: ca⊢(시작 후 시간 기록) 및 ca⊣(종료 후 시간 기록) 주 자동기계 (정의 26):
전체 규획 과정의 상태 전이를 제어하며, 초기화 및 목표 검사를 포함한다.
동작 자동기계 (정의 27):
각 동작에 대응하는 자동기계로, 다음의 주요 전이를 포함한다:
sea: 동작 시작의 효과 적용 se'a: 불변 조건 잠금 eea: 종료 전 준비 ee'a: 동작 종료의 효과 적용 iea: 순간 동작 처리 주 자동기계와 모든 동작 자동기계를 시간 자동기계 네트워크로 결합(정의 28)하며, 초기 구성은 모든 자동기계를 비활성 상태로 설정한다.
동시 실행 지원 : Heinz 등이 전역 잠금을 사용하는 것과 달리, 본 논문은 시계 제약을 사용하여 동시 스냅샷 동작 실행을 허용순간 동작 처리 : iea 전이 추가를 통해 영 지속 시간의 순간 동작 지원형식 검증 : 처음으로 이러한 유형의 인코딩에 대한 기계 검사 정확성 증명 제공의미론 단순화 : 형식 추론에 더 적합한 시간 규획 의미론 설계정리 증명기 : Isabelle/HOL인증서 검사기 : Wimmer와 von Mutius의 검증된 인증서 검사기목표 성질 : 도달 가능성 검사 A ⊨ EF(loc(AM) = goal)구성 요소 코드 줄 수 추상 시간 규획 의미론 형식화 ~7,200 Munta를 사용한 시간 자동기계 네트워크 정의 ~800 정리 1 및 관련 보조정리의 증명 ~8,500 리스트 관련 보조정리 ~1,500 합계 ~18,000
관련 형식 검증 작업의 규모 비교:
검증된 SAT 기반 규획기: ~17,500줄 검증된 고전 규획 검증기: ~3,000줄 검증된 시간 PDDL 규획 검증기: ~6,500줄 정리 1(주요 정확성 정리) :
계획 π가 유효하고 자기 중복이 없으면(valid(π) ∧ no_self_overlap(π)), 단언 A ⊨ EF(loc(AM) = goal)이 성립한다.
증명 구조 :
보조정리 1 : 병렬 계획 실행을 시뮬레이트하는 실행 구축보조정리 2 : 초기 구성에서 인코딩된 상태로의 도달 가능성보조정리 3 : 최종 상태에서 목표 구성으로의 전이완전성 증명 : 인코딩의 완전성을 성공적으로 증명하여, 모든 유효한 계획이 대응하는 시간 자동기계 네트워크에서 유효한 실행을 찾을 수 있음을 보임기계 검사 : 모든 증명이 Isabelle/HOL의 기계 검사를 통과하여 최고 수준의 신뢰성 보장 제공모듈식 설계 : 증명 구조가 모듈식이어서 이해 및 유지보수가 용이함인코딩 구현이 기존 검증된 인증서 검사기와 호환되는 형식으로 적응되어 완전한 실행 가능한 인증 체인을 형성한다.
Eriksson 등은 고전 규획을 위한 간결한 불가해성 인증 방안을 설계 Abdulaziz와 Lammich는 고전 규획의 형식 검증기 제공 Dierks 등은 PDDL 부분집합에서 시간 자동기계로의 정적 축약 구현 Heinz 등은 시간 규획 문제에서 시간 자동기계로의 명시적 인코딩 정의 Gigante 등은 이론 수준에서 시간 규획의 복잡성 연구 Abdulaziz와 Kurz는 유사한 방법을 사용하여 인증된 SAT 기반 규획 시스템 개발 Kumar 등과 Leroy는 컴파일러 검증에서 단계적 인코딩 검증 방법 사용 가능성 검증 : 시간 규획 불가해성의 형식 인증이 가능함을 증명이론적 보장 : 정리 증명기를 통해 강력한 정확성 보장 제공공학적 구현 : 완전한 인증 도구 체인 성공적 구축입력 제한 : 현재 이미 인스턴스화된 시간 규획 문제만 수용의미론 부분집합 : 지원되는 의미론은 검증된 규획 검증기의 부분집합실행 가능성 : 인증 메커니즘이 아직 완전히 실행 가능하지 않음동등성 증명 : 본 논문의 의미론과 기존 검증기 의미론의 동등성을 형식 증명할 계획실행 가능한 구현 : 실행 가능한 인증서 검사기 개발인스턴스화 검증 : Helmert의 데이터로그 솔버와 같은 인스턴스화 알고리즘의 형식 검증제약 완화 : 자기 중복 없음 조건 완화의 가능성 연구이론적 엄밀성 : 시간 규획 불가해성 인증에 대한 기계 검사 형식 증명을 처음으로 제공공학적 완전성 : 이론 프레임워크뿐만 아니라 기존 도구와의 통합도 구현방법 혁신성 :
동시 실행을 지원하는 인코딩 설계 순간 동작 처리의 우아한 솔루션 단순화되고 동등한 의미론 설계 신뢰성 보장 : 정리 증명기를 통해 최고 수준의 정확성 보장 제공실용성 제한 :
사전 인스턴스화된 입력 필요 아직 완전히 실행 가능하지 않음 성능 평가 부재 커버리지 범위 : 시간 규획의 부분집합만 지원하며, 완전한 PDDL 기능 미지원확장성 : 18,000줄의 형식 검증 작업 규모가 크므로 유지보수 비용이 높음학술적 기여 :시간 규획 형식 검증의 공백 해소 불가해성 인증에 대한 새로운 이론적 기초 제공 복잡한 시스템의 형식 검증 가능성 시연 실용적 가치 :중요 응용 분야에서 신뢰할 수 있는 규획 시스템 인증 제공 다른 규획 형식 및 제약 만족 문제로 확장 가능 자동화 검증 도구 개발에 참고 자료 제공 재현성 : 오픈소스 Isabelle/HOL을 기반으로 하므로 이론적으로 완전히 재현 가능중요 시스템 : 높은 신뢰성 보장이 필요한 규획 응용(항공우주, 의료기기 등)연구 도구 : 시간 규획 연구를 위한 형식 검증 기초 시설 제공교육 용도 : 형식 방법 및 규획 알고리즘 교육의 사례로 활용도구 개발 : 신뢰할 수 있는 규획 도구 개발을 위한 이론적 기초 제공주요 참고문헌:
Abdulaziz & Koller (2022): 시간 규획의 형식 의미론 및 검증기 Heinz et al. (2019): 시간 규획에서 시간 자동기계로의 인코딩 Wimmer & von Mutius (2020): 시간 자동기계의 검증된 인증서 검사기 Abdulaziz & Kurz (2023): 검증된 SAT 기반 규획 시스템 이 논문은 시간 규획의 형식 검증 분야에서 중요한 기여를 하였으며, 실용성 측면에서 개선할 여지가 있지만, 이론적 엄밀성과 방법 혁신성은 해당 분야의 발전을 위한 견고한 기초를 마련하였다.