2025-11-10T02:38:03.962319

Substitution Without Copy and Paste

Altenkirch, Burke, Wadler

Defining substitution for a language with binders like the simply typed $Î»$-calculus requires repetition, defining substitution and renaming separately. To verify the categorical properties of this calculus, we must repeat the same argument many times. We present a lightweight method that avoids repetition and that gives rise to a simply typed category with families (CwF) isomorphic to the initial simply typed CwF. Our paper is a literate Agda script.

academic

Substitution Without Copy and Paste

基本信息

论文ID: 2510.12304
标题: Substitution Without Copy and Paste
作者: Thorsten Altenkirch (University of Nottingham), Nathaniel Burke (Imperial College London), Philip Wadler (University of Edinburgh and Input Output)
分类: cs.LO (Logic in Computer Science)
发表会议: LFMTP 2025 (International Workshop on Logical Frameworks and Meta-Languages: Theory and Practice)
论文链接: https://arxiv.org/abs/2510.12304

摘要

在定义带有绑定器的语言（如简单类型λ演算）的替换操作时，通常需要分别定义替换和重命名操作，导致大量重复代码。为了验证该演算的范畴性质，必须多次重复相同的论证。本文提出了一种轻量级方法来避免这种重复，并构建了一个与初始简单类型范畴族(CwF)同构的简单类型CwF。论文以Agda文学化编程脚本的形式呈现。

研究背景与动机

核心问题

在机械化证明中定义带绑定器语言的替换操作时，传统方法需要：

分别定义变量重命名（∆ ⊩v Γ）和项替换（∆ ⊩ Γ）
重复实现四种不同的替换操作：变量对变量、变量对项、项对变量、项对项
重复证明所有组合的函子律，导致8个不同的证明案例

研究动机

软件工程原则：避免复制粘贴代码，这在形式化证明中尤为重要
理论意义：为依赖类型理论中的替换定义提供基础
实际应用：在高阶范畴中解释依赖类型的一致性问题

现有方法局限性

代码重复：需要为变量和项分别定义相似的操作
证明重复：范畴律的证明需要覆盖所有组合，导致大量重复论证
维护困难：修改一处需要同步更新多个相似定义

核心贡献

统一框架：提出基于Sort参数的统一替换操作，将变量和项的处理合并为单一定义
终止性保证：巧妙利用Agda的结构递归和字典序终止检查，确保定义的良基性
范畴理论验证：证明递归定义的替换满足简单类型CwF的所有律
初始性结果：建立递归替换语法与初始CwF之间的同构关系
标准化定理：λ项的替换标准形式对应于无显式替换的λ项

方法详解

任务定义

构建一个统一的替换系统，使得：

输入：项/变量和替换/重命名的任意组合
输出：相应类型的替换结果
约束：保持类型安全性和终止性

核心技术：Sort系统

Sort类型定义

data Sort : Set where
  V : Sort
  T>V : (s : Sort) → IsV s → Sort

data IsV : Sort → Set where
  isV : IsV V

pattern T = T>V V isV

这个定义巧妙地使V在结构上小于T，满足Agda终止检查要求。

统一的项和替换定义

data _ ⊢ [_]_ : Con → Sort → Ty → Set where
  zero : Γ ▷ A ⊢ [ V ] A
  suc : Γ ⊢ [ V ] A → (B : Ty) → Γ ▷ B ⊢ [ V ] A
  `_ : Γ ⊢ [ V ] A → Γ ⊢ [ T ] A
  _ ·_ : Γ ⊢ [ T ] A ⇒ B → Γ ⊢ [ T ] A → Γ ⊢ [ T ] B
  λ_ : Γ ▷ A ⊢ [ T ] B → Γ ⊢ [ T ] A ⇒ B

其中Γ ⊢ [ V ] A对应变量，Γ ⊢ [ T ] A对应项。

Sort上的格结构

data _ ⊑ _ : Sort → Sort → Set where
  rfl : s ⊑ s
  v⊑t : V ⊑ T

_⊔_ : Sort → Sort → Sort
V ⊔ r = r
T ⊔ r = T

统一替换操作

核心替换函数

_[_] : Γ ⊢ [ q ] A → ∆ ⊩ [ r ] Γ → ∆ ⊢ [ q ⊔ r ] A

关键洞察：结果的sort是输入sorts的最小上界，确保只有当两个输入都是变量/重命名时，结果才是变量。

终止性处理

通过Sort多态的恒等函数解决终止性问题：

id-poly : Γ ⊩ [ q ] Γ
id : Γ ⊩ [ V ] Γ
id = id-poly {q = V}

技术创新点

结构化递归：利用Sort的结构顺序和字典序测度确保终止性
参数多态：通过Sort参数统一处理变量和项的不同情况
格理论应用：使用⊔操作优雅处理类型提升
重写规则：利用Agda的REWRITE功能简化等式推理

[id] : x [ id ] ≡ x

通过结构归纳证明，关键是变量情况下的自然性引理。

结合律

[◦] : x [ xs ◦ ys ] ≡ x [ xs ] [ ys ]

需要与左恒等律互递归证明，体现了范畴结构的内在联系。

CwF结构验证

论文证明了递归替换语法满足简单类型CwF的所有公理：

范畴结构：上下文和替换构成范畴
预层结构：每个类型对应一个预层
终端对象：空上下文
上下文扩展：类似于范畴积的结构

初始性定理

建立了两个方向的映射：

标准化 norm : Γ ⊢I A → Γ ⊢ [ T ] A
嵌入 ⌜_⌝ : Γ ⊢ [ q ] A → Γ ⊢I A

并证明它们互为逆映射：

稳定性 norm ⌜ t ⌝ ≡ t
完备性 ⌜ norm t ⌝ ≡ t

实现细节

Agda特性利用

归纳-归纳类型：Sort和IsV的相互定义
字典序终止：支持复杂的递归模式
重写规则：自动化等式推理
模式同义词：简化复杂类型的使用

终止性分析

通过调用图分析证明终止性，每个函数的测度：

_[_]：(r, t)
id：(r, Γ)
_+_：(r, σ)
suc[_]：(q)

在所有循环中，要么Sort严格递减，要么Sort保持而其他参数递减。

结论与讨论

主要结论

方法论贡献：证明了通过Sort参数化可以优雅地统一替换操作
理论贡献：建立了递归替换语法的初始性
实践贡献：提供了避免重复的具体技术方案

局限性

依赖Agda特性：需要字典序终止检查支持
复杂性转移：虽然避免了重复，但增加了Sort系统的复杂性
扩展挑战：向依赖类型扩展仍需进一步研究

未来方向

依赖类型扩展：将方法应用到完整的依赖类型理论
高阶一致性：在高阶范畴中的应用
其他证明助手：在Lean、Coq等系统中的移植

深度评价

优点

技术创新性：Sort系统的设计巧妙地解决了终止性和统一性问题
理论完整性：从基本定义到初始性的完整理论发展
实用价值：为形式化验证中的常见问题提供了实用解决方案
表述清晰：作为文学化编程脚本，代码和解释结合良好

不足

平台依赖：严重依赖Agda的特定特性，可移植性有限
复杂度权衡：虽然避免了重复，但引入了新的概念复杂性
扩展性未知：向更复杂类型系统的扩展仍需验证

影响力

理论贡献：为类型理论的机械化提供了新思路
实践指导：为形式化验证实践者提供了有用工具
研究启发：为依赖类型理论的进一步研究奠定基础

适用场景

形式化验证：需要处理绑定器的语言定义
类型理论研究：CwF和初始代数的研究
编程语言理论：λ演算及其扩展的机械化

参考文献

论文引用了该领域的重要工作，包括：

De Bruijn的原始工作12
McBride的kit方法18
Allais等人的类型安全方法5
Autosubst系列工作21,22
相对单子的相关研究6

这些引用体现了作者对领域发展的深入理解和对现有工作的充分调研。