2025-11-10T02:38:03.962319

Substitution Without Copy and Paste

Altenkirch, Burke, Wadler

Defining substitution for a language with binders like the simply typed $Î»$-calculus requires repetition, defining substitution and renaming separately. To verify the categorical properties of this calculus, we must repeat the same argument many times. We present a lightweight method that avoids repetition and that gives rise to a simply typed category with families (CwF) isomorphic to the initial simply typed CwF. Our paper is a literate Agda script.

academic

Substitution Without Copy and Paste

Grundlegende Informationen

Paper-ID: 2510.12304
Titel: Substitution Without Copy and Paste
Autoren: Thorsten Altenkirch (University of Nottingham), Nathaniel Burke (Imperial College London), Philip Wadler (University of Edinburgh and Input Output)
Klassifizierung: cs.LO (Logik in der Informatik)
Veröffentlichungskonferenz: LFMTP 2025 (International Workshop on Logical Frameworks and Meta-Languages: Theory and Practice)
Paper-Link: https://arxiv.org/abs/2510.12304

Zusammenfassung

Bei der Definition von Substitutionsoperationen für Sprachen mit Bindern (wie dem einfach typisierten λ-Kalkül) ist es üblich, Substitutions- und Umbenennungsoperationen separat zu definieren, was zu erheblicher Code-Duplizierung führt. Um die kategorischen Eigenschaften des Kalküls zu verifizieren, müssen identische Argumente mehrfach wiederholt werden. Dieses Paper präsentiert einen leichtgewichtigen Ansatz zur Vermeidung dieser Wiederholungen und konstruiert eine einfach typisierte CwF (Contextual Weak Functor), die isomorph zu einer Familie initialer einfach typisierter CwFs ist. Das Paper wird als literarisches Agda-Programmierskript präsentiert.

Forschungshintergrund und Motivation

Kernproblem

Bei der mechanisierten Beweisführung zur Definition von Substitutionsoperationen für Sprachen mit Bindern erfordert die traditionelle Methode:

Separate Definition von Variablenumbennung (∆ ⊩v Γ) und Termsubstitution (∆ ⊩ Γ)
Wiederholte Implementierung von vier verschiedenen Substitutionsoperationen: Variable-zu-Variable, Variable-zu-Term, Term-zu-Variable, Term-zu-Term
Wiederholte Beweise aller Kombinationen von Funktorgesetzen, was zu 8 verschiedenen Beweisfällen führt

Forschungsmotivation

Softwareentwicklungsprinzipien: Vermeidung von Copy-Paste-Code, was in der formalen Beweisführung besonders wichtig ist
Theoretische Bedeutung: Bereitstellung einer Grundlage für Substitutionsdefinitionen in abhängig typisierten Theorien
Praktische Anwendung: Interpretation abhängig typisierter Theorien in höheren Kategorien

Einschränkungen bestehender Methoden

Code-Duplizierung: Ähnliche Operationen müssen separat für Variablen und Terme definiert werden
Beweis-Duplizierung: Kategorische Gesetze erfordern Beweise für alle Kombinationen, was zu erheblichen Wiederholungen führt
Wartungsschwierigkeiten: Änderungen an einer Stelle erfordern Synchronisierung mehrerer ähnlicher Definitionen

Kernbeiträge

Einheitliches Framework: Präsentation eines einheitlichen Substitutionsoperators basierend auf Sort-Parametrisierung, der die Behandlung von Variablen und Termen in einer einzigen Definition zusammenführt
Terminierungsgarantie: Geschickte Nutzung von Agdas struktureller Rekursion und lexikographischer Terminierungsprüfung zur Gewährleistung der Wohldefiniertheit
Kategorische Verifikation: Beweis, dass die rekursive Definition der Substitution alle Gesetze der einfach typisierten CwF erfüllt
Initialitätsergebnis: Etablierung eines Isomorphismus zwischen der rekursiven Substitutionssyntax und der initialen CwF
Normalisierungssatz: Die Normalform der Substitution von λ-Termen entspricht λ-Termen ohne explizite Substitution

Methodische Details

Aufgabenstellung

Konstruktion eines einheitlichen Substitutionssystems, das:

Eingabe: Beliebige Kombinationen von Termen/Variablen und Substitutionen/Umbenennungen
Ausgabe: Entsprechende Substitutionsergebnisse
Einschränkungen: Beibehaltung von Typsicherheit und Terminierung

Kerntechnik: Sort-System

Sort-Typdefinition

data Sort : Set where
  V : Sort
  T>V : (s : Sort) → IsV s → Sort

data IsV : Sort → Set where
  isV : IsV V

pattern T = T>V V isV

Diese Definition macht V strukturell kleiner als T und erfüllt damit die Anforderungen von Agdas Terminierungsprüfung.

Einheitliche Definitions von Termen und Substitutionen

data _ ⊢ [_]_ : Con → Sort → Ty → Set where
  zero : Γ ▷ A ⊢ [ V ] A
  suc : Γ ⊢ [ V ] A → (B : Ty) → Γ ▷ B ⊢ [ V ] A
  `_ : Γ ⊢ [ V ] A → Γ ⊢ [ T ] A
  _ ·_ : Γ ⊢ [ T ] A ⇒ B → Γ ⊢ [ T ] A → Γ ⊢ [ T ] B
  λ_ : Γ ▷ A ⊢ [ T ] B → Γ ⊢ [ T ] A ⇒ B

Dabei entspricht Γ ⊢ [ V ] A Variablen und Γ ⊢ [ T ] A Termen.

Gitterstruktur auf Sort

data _ ⊑ _ : Sort → Sort → Set where
  rfl : s ⊑ s
  v⊑t : V ⊑ T

_⊔_ : Sort → Sort → Sort
V ⊔ r = r
T ⊔ r = T

Einheitliche Substitutionsoperation

Kern-Substitutionsfunktion

_[_] : Γ ⊢ [ q ] A → ∆ ⊩ [ r ] Γ → ∆ ⊢ [ q ⊔ r ] A

Schlüsseleinsicht: Der Sort des Ergebnisses ist die kleinste obere Grenze der Input-Sorts, was sicherstellt, dass das Ergebnis nur dann eine Variable ist, wenn beide Eingaben Variablen/Umbenennungen sind.

Terminierungsbehandlung

Lösung des Terminierungsproblems durch Sort-polymorphe Identitätsfunktion:

id-poly : Γ ⊩ [ q ] Γ
id : Γ ⊩ [ V ] Γ
id = id-poly {q = V}

Technische Innovationen

Strukturierte Rekursion: Nutzung der Sortstruktur und lexikographischer Maße zur Gewährleistung der Terminierung
Parametrischer Polymorphismus: Einheitliche Behandlung verschiedener Fälle von Variablen und Termen durch Sort-Parameter
Gittertheorie-Anwendung: Elegante Behandlung von Typerhöhung durch die ⊔-Operation
Umschreiberegeln: Nutzung von Agdas REWRITE-Funktionalität zur Vereinfachung der Gleichheitsbeweisführung

Theoretische Verifikation

Kategorische Gesetze

Identitätsgesetz

[id] : x [ id ] ≡ x

Beweis durch strukturelle Induktion; der Schlüssel ist ein Naturheitssatz für den Variablenfall.

Assoziativgesetz

[◦] : x [ xs ◦ ys ] ≡ x [ xs ] [ ys ]

Erfordert gegenseitige Rekursion mit dem linken Identitätsgesetz, was die innere Verbindung der kategorischen Struktur widerspiegelt.

CwF-Strukturverifikation

Das Paper beweist, dass die rekursive Substitutionssyntax alle Axiome der einfach typisierten CwF erfüllt:

Kategorische Struktur: Kontexte und Substitutionen bilden eine Kategorie
Prägarben-Struktur: Jeder Typ entspricht einer Prägarbe
Terminales Objekt: Der leere Kontext
Kontexterweiterung: Struktur ähnlich dem kategorischen Produkt

Initialitätssatz

Etablierung von Abbildungen in beiden Richtungen:

Normalisierung norm : Γ ⊢I A → Γ ⊢ [ T ] A
Einbettung ⌜_⌝ : Γ ⊢ [ q ] A → Γ ⊢I A

und Beweis, dass sie zueinander invers sind:

Stabilität norm ⌜ t ⌝ ≡ t
Vollständigkeit ⌜ norm t ⌝ ≡ t

Implementierungsdetails

Nutzung von Agda-Funktionen

Induktiv-induktive Typen: Gegenseitige Definition von Sort und IsV
Lexikographische Terminierung: Unterstützung komplexer Rekursionsmuster
Umschreiberegeln: Automatisierung der Gleichheitsbeweisführung
Muster-Synonyme: Vereinfachung der Verwendung komplexer Typen

Terminierungsanalyse

Beweis der Terminierung durch Aufrufgraphanalyse; das Maß für jede Funktion:

_[_]: (r, t)
id: (r, Γ)
_+_: (r, σ)
suc[_]: (q)

In allen Zyklen nimmt entweder der Sort streng ab, oder der Sort bleibt gleich während andere Parameter abnehmen.

Vergleich mit verwandten Arbeiten

Unterschiede zu bestehenden Methoden

Kit-Methode18,5: Abstraktion gemeinsamer Muster von Umbennung und Substitution durch Kits, erfordert aber immer noch wiederholte Beweise
Monadische Perspektive6,9: Kodierung von Substitution als Funktion von Variablen zu Termen, schwer auf abhängige Typen erweiterbar
Automatisierungswerkzeuge21,22: Die Autosubst-Bibliothek generiert automatisch Substitutionslemmata, aber die Grundlage enthält immer noch Wiederholungen

Vorteilsanalyse

Einfachheit: In Sprachen mit Unterstützung für lexikographische Rekursion einfacher
Einheitlichkeit: Eine einzige Definition deckt alle Fälle ab
Erweiterbarkeit: Grundlage für die Behandlung abhängig typisierter Theorien

Schlussfolgerungen und Diskussion

Hauptschlussfolgerungen

Methodischer Beitrag: Beweis, dass Sort-Parametrisierung Substitutionsoperationen elegant vereinheitlichen kann
Theoretischer Beitrag: Etablierung der Initialität der rekursiven Substitutionssyntax
Praktischer Beitrag: Bereitstellung konkreter technischer Lösungen zur Vermeidung von Wiederholungen

Einschränkungen

Abhängigkeit von Agda-Funktionen: Erfordert Unterstützung für lexikographische Terminierungsprüfung
Komplexitätsverlagerung: Obwohl Wiederholungen vermieden werden, erhöht sich die Komplexität des Sort-Systems
Erweiterungsherausforderungen: Erweiterung auf abhängige Typen erfordert weitere Forschung

Zukünftige Richtungen

Erweiterung auf abhängige Typen: Anwendung der Methode auf vollständige abhängig typisierte Theorien
Höhere Kohärenz: Anwendungen in höheren Kategorien
Andere Beweisassistenten: Portierung auf Lean, Coq und andere Systeme

Tiefgreifende Bewertung

Stärken

Technische Innovativität: Das Sort-System-Design löst elegant das Terminierungs- und Einheitlichkeitsproblem
Theoretische Vollständigkeit: Vollständige theoretische Entwicklung von grundlegenden Definitionen bis zur Initialität
Praktischer Wert: Bietet praktische Lösungen für häufige Probleme in der formalen Verifikation
Klare Darstellung: Als literarisches Programmierskript ist die Kombination von Code und Erklärung gut gelungen

Schwächen

Plattformabhängigkeit: Starke Abhängigkeit von spezifischen Agda-Funktionen, begrenzte Portabilität
Komplexitäts-Tradeoff: Obwohl Wiederholungen vermieden werden, werden neue konzeptuelle Komplexitäten eingeführt
Unbekannte Erweiterbarkeit: Erweiterung auf komplexere Typensysteme erfordert weitere Verifikation

Einfluss

Theoretischer Beitrag: Bietet neue Perspektiven für die Mechanisierung von Typtheorie
Praktische Anleitung: Bietet nützliche Werkzeuge für Praktiker der formalen Verifikation
Forschungsinspiration: Legt Grundlagen für weitere Forschung in abhängig typisierten Theorien

Anwendungsszenarien

Formale Verifikation: Sprachdefinitionen, die mit Bindern umgehen müssen
Typtheorie-Forschung: Forschung zu CwF und initialen Algebren
Programmiersprachen-Theorie: Mechanisierung des λ-Kalküls und seiner Erweiterungen

Literaturverzeichnis

Das Paper zitiert wichtige Arbeiten in diesem Bereich, darunter:

De Bruijns Originalarbeit12
McBrides Kit-Methode18
Allais et al. typensichere Ansätze5
Autosubst-Serie21,22
Verwandte Forschung zu relativen Monaden6

Diese Zitate zeigen das tiefe Verständnis des Autors für die Entwicklung des Feldes und die gründliche Recherche bestehender Arbeiten.