2025-11-21T20:52:15.308162

Representations

Brunet
The formal analysis of automated systems is an important and growing industry. This activity routinely requires new verification frameworks to be developed to tackle new programming features, or new considerations (bugs of interest). Often, one particular property can prove frustrating to establish: completeness of the logic with respect to the semantics. In this paper, we try and make such developments easier, with a particular attention on completeness. Towards that aim, we propose a formal (meta-)model of software analysis systems (SAS), the eponymous Representations. This model requires few assumptions on the SAS being modelled, and as such is able to capture a large class of such systems. We then show how our approach can be fruitful, both to understand how existing completeness proofs can be structured, and to leverage this structure to build new systems and prove their completeness.
academic

Darstellungen

Grundinformationen

  • Papier-ID: 2510.11419
  • Titel: Darstellungen
  • Autor: Paul Brunet (EPISEN & LACL, Université Paris-Est Créteil Val de Marne)
  • Klassifizierung: cs.LO (Logik in der Informatik)
  • Veröffentlichungsdatum: 14. Oktober 2025 (arXiv-Version)
  • Papierlink: https://arxiv.org/abs/2510.11419

Zusammenfassung

Die formale Analyse automatisierter Systeme ist ein wichtiges und sich ständig entwickelndes Gebiet. Diese Aktivität erfordert typischerweise die Entwicklung neuer Verifikationsrahmen zur Behandlung neuer Programmierfunktionen oder neuer Überlegungen (Fehler von Interesse). Eine besonders frustrierende Eigenschaft ist die Etablierung der Vollständigkeit einer Logik in Bezug auf die Semantik. In diesem Papier versucht der Autor, solche Entwicklungen zu erleichtern, mit besonderem Fokus auf Vollständigkeit. Zu diesem Zweck wird eine formale (Meta-)Modellierung von Softwareanalysesystemen (SAS) vorgeschlagen, die sogenannte "Darstellungen" (Representations). Dieses Modell stellt nur minimale Anforderungen an die modellierten SAS und kann daher eine große Klasse solcher Systeme erfassen. Anschließend wird gezeigt, wie dieser Ansatz fruchtbar ist, sowohl um die Struktur bestehender Vollständigkeitsbeweise zu verstehen als auch um diese Struktur zu nutzen, um neue Systeme zu konstruieren und deren Vollständigkeit zu beweisen.

Forschungshintergrund und Motivation

Problembeschreibung

Mit der zunehmend vielfältigeren Aufgabenstellung automatisierter Systeme wächst die Bedeutung und Vielfalt formaler Analysefragen. Während das Gebiet vor kurzem noch hauptsächlich von der Untersuchung kritischer Systeme und ihrer potenziellen Ausfälle dominiert wurde, sehen wir nun auch Fragen wie Dienstqualität, die durch formale Analyse gelöst werden.

Kernherausforderungen

Die Korrektheit von Softwareanalysesystemen (SAS) hängt von zwei Eigenschaften ab:

  1. Korrektheit (Soundness): Jedes gültige Urteil in der Logik wird durch die Semantik erfüllt
  2. Vollständigkeit (Completeness): Jedes semantisch korrekte Urteil kann durch die Logik etabliert werden

Vollständigkeit ist typischerweise der schwierige Teil von Korrektheitsbeweisen, da zwar Korrektheit durch Überprüfung der Korrektheit einzelner Logikregeln etabliert werden kann, Vollständigkeit jedoch erfordert, dass der Beweiser für jede wahre semantische Tatsache eine Ableitung erzeugt, ohne dass eine universelle Methode anwendbar zu sein scheint.

Forschungsmotivation

Der Autor möchte eine modulare Metasystem-Grundlage bereitstellen, die auf transparente Weise korrekte und vollständige SAS erzeugen kann. Ein solches Werkzeug würde es ermöglichen, formale Analysetechniken auf eine breitere Klasse von Systemen und Fragen über sie anzuwenden.

Kernbeiträge

  1. Vorschlag eines formalen Modells von Darstellungen: Ein universeller Rahmen zur Beschreibung von Softwareanalysesystemen mit minimalen Annahmen
  2. Etablierung der kategorientheoretischen Struktur von Darstellungen: Definition von Homomorphismen zwischen Darstellungen, Beweis, dass die Kategorie der Darstellungen kartesisch ist
  3. Bereitstellung einer universellen Vorlage für Vollständigkeitsbeweise: Durch das Konzept der "Reduktionen" wird eine deduktive Vollständigkeitsvorlage gegeben
  4. Entwicklung einer höherstufigen Darstellungstheorie: Durch Funktoren von der Mengenkategorie zur Darstellungskategorie werden parametrisierte Darstellungen charakterisiert
  5. Demonstration der praktischen Anwendbarkeit der Theorie: Durch mehrere Instanzen von Kleene-Algebren und deren Erweiterungen wird die Wirksamkeit des Ansatzes validiert

Methodische Details

Definition von Darstellungen

Definition 1 (Darstellung): Eine Darstellung ist ein Quadrupel R=T,E,=,R = \langle T, E, |=, \leq \rangle, wobei:

  • TT die Menge der Spuren (traces) ist
  • EE die Menge der Ausdrücke ist
  • =:TE|=: T \rightharpoonup E die Erfüllungsrelation ist
  • \leq eine Vorordnung auf EE ist, die =;=|= ; \leq \subseteq |= erfüllt

Eine Darstellung heißt präzise, wenn (=\=)(|= \backslash |=) \subseteq \leq erfüllt ist.

Relationalalgebraische Formulierung

Mit Relationalalgebra können Korrektheit und Vollständigkeit wie folgt ausgedrückt werden:

  • Korrektheit: =;=|= ; \leq \subseteq |= (Axiom 1)
  • Vollständigkeit: =\=|= \backslash |= \subseteq \leq (Axiom 2)

wobei =\=|= \backslash |= die semantische Inklusionsrelation darstellt.

Kategorie der Darstellungen

Definition 2 (Morphismus): Gegeben zwei Darstellungen R1R_1 und R2R_2 ist ein Morphismus von der ersten zur zweiten ein Paar ϕ,ψ:R1R2\langle \phi, \psi \rangle: R_1 \to R_2, das erfüllt:

  • ϕ:E1E2\phi: E_1 \to E_2 ist eine Funktion, ψ:T2T1\psi: T_2 \rightharpoonup T_1 ist eine Relation
  • ϕ\phi ist ordnungserhaltend: ϕ;12;ϕ\phi^*; \leq_1 \subseteq \leq_2; \phi^*
  • Interpretationskompatibilität: =2;ϕ=ψ;=1|=_2; \phi^* = \psi; |=_1

Proposition 1: Wenn R1R_1 und R2R_2 beide präzise sind, dann ist auch ihr Produkt präzise.

Reduktionstheorie

Definition 3 (Reduktion): Eine Reduktion von Darstellung R1R_1 zu R2R_2 ist ein Tripel ϕ,τ,ψ:R1R2\langle \phi, \tau, \psi \rangle: R_1 \rightsquigarrow R_2, das erfüllt:

  • ϕ:E1E2\phi: E_1 \to E_2 und τ:E2E1\tau: E_2 \to E_1 sind Funktionen, ψ:T2T1\psi: T_2 \rightharpoonup T_1 ist eine Relation
  • τ\tau ist ordnungserhaltend: τ;21;τ\tau^*; \leq_2 \subseteq \leq_1; \tau^*
  • Interpretationskompatibilität: =2;ϕ=ψ;=1|=_2; \phi^* = \psi; |=_1
  • Äquivalenz: τ;ϕ1\tau^* ; \phi^* \subseteq \leq_1 und ϕ;τ1\phi^* ; \tau^* \subseteq \leq_1

Proposition 2: R1R_1 ist präzise genau dann, wenn es eine präzise Darstellung R2R_2 und eine Reduktion R1R2R_1 \rightsquigarrow R_2 gibt.

Höherstufige Darstellungen

Definition 9 (HOR): Eine höherstufige Darstellung ist eine Struktur R=T,E,=,R = \langle \mathcal{T}, \mathcal{E}, ||=, \preceq \rangle, wobei:

  • E\mathcal{E} und T\mathcal{T} Endfunktoren der Mengenkategorie sind
  • =:TE||=: \mathcal{T} \rightharpoonup \mathcal{E} eine rechtslineare Relation ist
  • :EE\preceq: \mathcal{E} \rightharpoonup \mathcal{E} eine natürliche Relation ist
  • Für jede Menge AA ist RA=TA,EA,=A,AR_A = \langle \mathcal{T}A, \mathcal{E}A, ||=_A, \preceq_A \rangle eine Darstellung

Experimentelle Einrichtung

Anwendungsbeispiele

Kleene-Algebren

Sei Reg(A)\text{Reg}(A) die Menge der regulären Ausdrücke über dem Alphabet AA. Die freie Kleene-Algebra erzeugt eine präzise Darstellung: KA(A):=A,Reg(A),=KA,KA\text{KA}(A) := \langle A^*, \text{Reg}(A), |=_{\text{KA}}, \leq_{\text{KA}} \rangle wobei w=KAew |=_{\text{KA}} e definiert ist als "w gehört zur rationalen Sprache, die mit e assoziiert ist".

Kleene-Algebren mit Tests (KAT)

Im Vollständigkeitsbeweis für KAT wird jeder Term pp in einen KAT-äquivalenten Term p^\hat{p} umgewandelt, so dass die Schutzzeichenkette G(p^)G(\hat{p}) mit der Zeichenkettenmenge R(p^)R(\hat{p}) unter regulärer Ausdrucksinterpretation identisch ist. Dies bildet eine Reduktion von der KAT-Darstellung zur KA-Darstellung.

Synchrone Kleene-Algebren (SKA)

Der Vollständigkeitsbeweis für SKA erfolgt in zwei Schritten:

  1. Etablierung der Vollständigkeit für eine Teilmenge von Ausdrücken
  2. Beweis, dass jeder Ausdruck in diese Teilsyntax übersetzt werden kann und beweisbare Äquivalenz bewahrt

Jeder Schritt ist eine Instanz einer Reduktion, und der gesamte Beweis kann als einzelne Reduktion verstanden werden.

Experimentelle Ergebnisse

Theoretische Validierung

Das Papier validiert die Wirksamkeit des theoretischen Rahmens durch mehrere Instanzen von Kleene-Algebra-Erweiterungen:

  1. KAT-Reduktion: ^,id,1\langle \hat{}, \text{id}, 1 \rangle bildet eine Reduktion von KAT zu KA
  2. SKA-Reduktion: Kombinierte Reduktion ^,id,Π\langle \hat{}, \text{id}, \Pi^* \rangle etabliert Vollständigkeit
  3. CKA-Reduktion: Reduktion durch syntaktische Abschlussfunktion \downarrow

Äquivalenz syntaktischer Abschlüsse

Lemma 1: Unter den Bedingungen von Definition 4, wenn zusätzlich 21\leq_2 \subseteq \leq_1, =2=1|=_2 \subseteq |=_1 und R2R_2 präzise ist, dann sind für jede Funktion :EE\downarrow: E \to E folgende äquivalent:

  1. ,id,1\langle \downarrow, \text{id}, 1 \rangle ist eine Reduktion
  2. \downarrow ist ein syntaktischer Abschluss

Anwendung höherstufiger Darstellungen

Das Papier zeigt, wie Relationen-HOR zu Funktoren erweitert werden:

  • PreOrdRepr\text{PreOrd} \to \text{Repr}: Behandlung freier Monoide über Vorordnungsmengen
  • ReprRepr\text{Repr} \to \text{Repr}: Erzeugung von Darstellungen, die durch andere Darstellungen parametrisiert sind

Verwandte Arbeiten

Institutionentheorie

Institutionen kapseln auch syntaktische und semantische Informationen in derselben Struktur, aber Institutionen enthalten mehrere Inferenzsysteme, während Darstellungen versuchen, ein Inferenzsystem zu erfassen. Die Definition von Institutionen ist restriktiver als die von Darstellungen und erfordert, dass sowohl Syntax als auch Semantik kategoriale Strukturen haben.

Spezifikationstheorien

Spezifikationstheorien, eingeführt von Fahrenberg und Legay, können als Struktur T,E,χ,\langle T, E, \chi, \leq \rangle verstanden werden, wobei χ:TE\chi: T \to E Spuren auf ihre charakteristischen Ausdrücke abbildet. Sie können durch Setzen von ==χ;|= = \chi^*; \leq in eine Darstellung umgewandelt werden, daher sind Spezifikationstheorien spezielle Instanzen von Darstellungen.

Schlussfolgerungen und Diskussion

Hauptschlussfolgerungen

  1. Darstellungen bieten einen universellen und flexiblen Rahmen zur Modellierung von Softwareanalysesystemen
  2. Die Reduktionstheorie bietet eine strukturierte Methode für Vollständigkeitsbeweise
  3. Höherstufige Darstellungen ermöglichen parametrisierte und modulare Systemkonstruktion
  4. Die Theorie wurde erfolgreich in Kleene-Algebren und deren Erweiterungen validiert

Einschränkungen

  1. Metatheorie-Wahl: Derzeit auf Set- und Rel-Kategorien basierend, aber möglicherweise existieren allgemeinere Abstraktionen
  2. Relationalalgebra-Fragment: Notwendigkeit, das "richtige" Relationalalgebra-Fragment zu bestimmen
  3. Praktische Anwendung: Mehr konkrete Verifikationsaufgaben erforderlich, um praktische Anwendbarkeit zu validieren

Zukünftige Richtungen

  1. Formale Verifikation: Formalisierung der Ergebnisse im Rocq-Beweissystem
  2. Kategorienforschung: Identifikation nützlicher Darstellungskategorien
  3. Konkrete Anwendungen: Anwendung der Theorie auf konkrete Verifikationsaufgaben
  4. Metatheorie-Abstraktion: Definition von Abstraktionen, die genaue Anforderungen ohne zusätzliche Annahmen erfassen

Tiefgreifende Bewertung

Stärken

  1. Theoretische Einheitlichkeit: Bietet einen einheitlichen Rahmen zum Verständnis verschiedener Softwareanalysesysteme
  2. Fokus auf Vollständigkeit: Besondere Aufmerksamkeit auf Vollständigkeit als schwieriges Problem mit systematischer Lösung
  3. Modulares Design: Realisierung modularer Beweise und Konstruktionen durch kategorientheoretische Methoden
  4. Reichhaltige Beispiele: Validierung der Theorieanwendbarkeit durch mehrere Kleene-Algebra-Erweiterungen
  5. Mathematische Strenge: Bereitstellung einer rigorosen mathematischen Grundlage durch Relationalalgebra und Kategorientheorie

Schwächen

  1. Hohes Abstraktionsniveau: Der theoretische Rahmen ist ziemlich abstrakt und könnte die Intuitivität praktischer Anwendungen einschränken
  2. Begrenzte Beispiele: Hauptbeispiele konzentrieren sich auf das Kleene-Algebra-Gebiet, Anwendbarkeit in anderen Gebieten bleibt zu überprüfen
  3. Mangel an Implementierungsdetails: Fehlende Diskussion konkreter Implementierungen oder Werkzeugunterstützung
  4. Fehlende Leistungsüberlegungen: Keine Diskussion der Auswirkungen der vorgeschlagenen Methode auf Rechenkomplexität

Einfluss

  1. Theoretischer Beitrag: Bereitstellung neuer theoretischer Werkzeuge für das Gebiet der formalen Methoden
  2. Methodologischer Wert: Mögliche Beeinflussung der Struktur und Methoden zukünftiger Vollständigkeitsbeweise
  3. Interdisziplinäres Potenzial: Die Universalität des Rahmens ermöglicht mögliche Anwendungen in mehreren Verifikationsgebieten
  4. Pädagogischer Wert: Bereitstellung einer einheitlichen Perspektive zum Verständnis von Beziehungen zwischen verschiedenen Verifikationssystemen

Anwendungsszenarien

  1. Entwicklung neuer Verifikationssysteme: Theoretische Anleitung für die Entwicklung neuer Softwareanalysesysteme
  2. Vollständigkeitsbeweise: Strukturierte Methode zur Etablierung der Vollständigkeit von Logik-Systemen
  3. Systemvergleichsanalyse: Einheitliche Grundlage für den Vergleich verschiedener Verifikationsrahmen
  4. Theoretische Forschung: Neue Werkzeuge für theoretische Forschung in formalen Methoden

Literaturverzeichnis

Das Papier zitiert 18 wichtige Literaturquellen, die mehrere verwandte Gebiete wie Relationalalgebra, Kategorientheorie, Kleene-Algebren und deren Erweiterungen abdecken und eine solide Grundlage für die theoretische Entwicklung bieten.