2025-11-12T00:52:30.352910

OFP-Repair: Repairing Floating-point Errors via Original-Precision Arithmetic

Tan, Ding, Chen et al.

Errors in floating-point programs can lead to severe consequences, particularly in critical domains such as military, aerospace, and financial systems, making their repair a crucial research problem. In practice, some errors can be fixed using original-precision arithmetic, while others require high-precision computation. Developers often avoid addressing the latter due to excessive computational resources required. However, they sometimes struggle to distinguish between these two types of errors, and existing repair tools fail to assist in this differentiation. Most current repair tools rely on high-precision implementations, which are time-consuming to develop and demand specialized expertise. Although a few tools do not require high-precision programs, they can only fix a limited subset of errors or produce suboptimal results. To address these challenges, we propose a novel method, named OFP-Repair.On ACESO's dataset, our patches achieve improvements of three, seven, three, and eight orders of magnitude across four accuracy metrics. In real-world cases, our method successfully detects all five original-precision-repairable errors and fixes three, whereas ACESO only repairs one. Notably, these results are based on verified data and do not fully capture the potential of OFP-Repair. To further validate our method, we deploy it on a decade-old open bug report from GNU Scientific Library (GSL), successfully repairing five out of 15 bugs. The developers have expressed interest in our method and are considering integrating our tool into their development workflow. We are currently working on applying our patches to GSL. The results are highly encouraging, demonstrating the practical applicability of our technique.

academic

OFP-Repair: Reparatur von Gleitkommafehler durch Originalgenauigkeitsarithmetik

Grundinformationen

Papier-ID: 2510.09938
Titel: OFP-Repair: Repairing Floating-point Errors via Original-Precision Arithmetic
Autoren: Youshuai Tan, Zishuo Ding, Jinfu Chen, Weiyi Shang
Klassifizierung: cs.SE (Softwaretechnik)
Veröffentlichungszeit/Konferenz: Conference'17, Washington, DC, USA (2025)
Papierlink: https://arxiv.org/abs/2510.09938

Zusammenfassung

Fehler in Gleitkommaprogrammen können schwerwiegende Folgen haben, besonders in kritischen Bereichen wie Militär-, Luft- und Raumfahrt- sowie Finanzsystemen. In der Praxis können einige Fehler durch Originalgenauigkeitsarithmetik repariert werden, während andere hochpräzise Berechnungen erfordern. Entwickler vermeiden typischerweise hochpräzise Methoden, da diese erhebliche Rechenressourcen benötigen. Allerdings fällt es Entwicklern schwer, diese beiden Fehlerklassen zu unterscheiden, und bestehende Reparaturwerkzeuge können bei dieser Unterscheidung nicht helfen. Um diese Herausforderungen zu bewältigen, wird die OFP-Repair-Methode vorgestellt, die ursprünglichgenauigkeitsreparierbare Fehler durch Berechnung der Konditionszahl des Programms relativ zur Eingabe identifiziert und einen einheitlichen Reparaturrahmen unter Verwendung von Reihenentwicklung konstruiert. Experimentelle Ergebnisse zeigen, dass die Methode auf vier Genauigkeitsmetriken Verbesserungen um jeweils 3, 7, 3 und 8 Größenordnungen erreicht.

Forschungshintergrund und Motivation

Problemdefinition

Gleitkommafehler in kritischen Systemen können katastrophale Folgen haben, wie der Ausfall des Patriot-Raketensystems oder die Explosion der Ariane-5-Rakete. Bestehende Forschungen zeigen, dass Gleitkommafehler hauptsächlich in zwei Kategorien eingeteilt werden:

Originalgenauigkeitsreparierbare Fehler: Können durch Umstrukturierung numerischer Ausdrücke in Originalgenauigkeit repariert werden
Hochgenauigkeitsabhängige Fehler: Erfordern hochpräzise Gleitkommaarithmetik zur Reparatur

Einschränkungen bestehender Methoden

Das Papier identifiziert drei Haupteinschränkungen:

Einschränkung 1: Sowohl Erkennungs- als auch Reparaturprozesse erfordern hochpräzise Programme, und die Umwandlung des Originalprogramms in eine hochpräzise Version erfordert tiefgreifendes mathematisches und numerisches Analysewissen
Einschränkung 2: Mangel an einheitlichem Reparaturparadigma für originalgenauigkeitsreparierbare Fehler; bestehende Werkzeuge können nur einen Teil dieser Fehler behandeln
Einschränkung 3: Mangel an Diagnosefähigkeit für diese Fehler; Entwickler können nicht bestimmen, ob ein Fehler durch Originalgenauigkeitsarithmetik repariert werden kann

Forschungsmotivation

Forschungen von Franco et al. zeigen, dass Entwickler Originalgenauigkeitsreparaturlösungen bevorzugen, da hochpräzise Lösungen hohe Rechenkosten verursachen. Beispielsweise wurde NumPy Issue #1063 wegen zu hoher Hochgenauigkeitskosten geschlossen. Allerdings können bestehende Werkzeuge Entwicklern nicht helfen, diese beiden Fehlertypen zu unterscheiden.

Kernbeiträge

Vorstellung der OFP-Repair-Methode: Das erste einheitliche Framework, das originalgenauigkeitsreparierbare Fehler effektiv erkennen und reparieren kann
Etablierung der theoretischen Grundlagen: Originalgenauigkeitsfehler-Erkennungs- und Reparaturmechanismus basierend auf Konditionszahltheorie und Taylor-Reihenentwicklung
Umfangreiche experimentelle Validierung: Validierung der Methode auf dem ACESO-Datensatz, echten Fehlern und zehn Jahre alten ungelösten GSL-Bug-Berichten
Praktischer Anwendungswert: Erfolgreiche Reparatur von 5 langfristig ungelösten Bugs in GSL mit Anerkennung durch Entwickler

Methodische Details

Aufgabendefinition

Eingabe: Programm mit Gleitkommafehlern und Eingabebereiche, die große Fehler auslösen
Ausgabe:
1. Fehlertyp-Bestimmung (originalgenauigkeitsreparierbar vs. hochgenauigkeitsabhängig)
2. Reparaturpatch für originalgenauigkeitsreparierbare Fehler
Einschränkung: Keine Abhängigkeit von hochpräzisen Programmimplementierungen

Theoretische Grundlagen

Analyse der Fehlerquellen

Das Papier beweist, dass signifikante Gleitkommafehler hauptsächlich aus Auslöschungseffekten (Cancellation) entstehen. Wenn zwei annähernd gleiche Gleitkommazahlen subtrahiert werden, führt dies zu einer drastischen Verringerung der wirksamen Präzisionsbits. Beispiel:

x = 3.14159265358973, y = 3.14159265358972
Theoretische Differenz: 1×10^-14
Gleitkommaberechnungsergebnis: 1.021405182655144×10^-14
Relativer Fehler: etwa 2,14%

Polynomdarstellung von Programmen

Basierend auf zwei Theoremen:

Theorem der Kontinuitätserhaltung arithmetischer Operationen: Arithmetische Operationen stetiger Funktionen bleiben stetig
Weierstrass-Approximationssatz: Stetige Funktionen können durch Polynome beliebig approximiert werden

Das Papier beweist, dass Gleitkommaprogramme innerhalb jeder Verzweigungsdomäne in Polynomdarstellung konvertiert werden können.

Erkennungsalgorithmus (Schritt 1)

Designgedanke

Verwendung der Konditionszahltheorie zur Bewertung der Auswirkung von Eingabestörungen auf die Ausgabe: $\left|\frac{f(x+\Delta x)-f(x)}{f(x)}\right| \approx \left|\frac{\Delta x}{x}\right| \cdot \left|\frac{xf'(x)}{f(x)}\right|$

wobei $\left|\frac{xf'(x)}{f(x)}\right|$ die Konditionszahl ist.

Erkennungsablauf

Verwendung von ATOMU zur Erkennung signifikanter Gleitkommafehler
Für jeden Fehler die Konditionszahl des Programms relativ zur Eingabe berechnen
Numerische Differentiation zur Ableitungsschätzung verwenden: $f'(x) \approx \frac{f(x+h)-f(x)}{h}$
Wenn die Konditionszahl unter dem Schwellenwert liegt (z.B. 10^5), als originalgenauigkeitsreparierbar klassifizieren

Beispielanalyse

Für die Funktion $\sin(x+\epsilon) - \sin(x)$ :

Konditionszahl relativ zu $\sin(x+\epsilon)$ : 9.0132×10^9 (sehr groß)
Konditionszahl relativ zur Eingabe $x$ : 3.40 (sehr klein)
Schlussfolgerung: Dieser Fehler kann durch Originalgenauigkeitsarithmetik repariert werden

Reparaturalgorithmus (Schritt 2)

Designprinzip

Verwendung von Taylor-Reihenentwicklung zur Umwandlung des Programms in eine auslöschungsfreie Polynomform: $f(x) = \sum_{n=0}^{\infty} \frac{f^{(n)}(a)}{n!}(x-a)^n$

Reparaturablauf

Wahl des Entwicklungspunktes (typischerweise in der Nähe des Punktes, der große Fehler verursacht)
Berechnung der ersten mehreren Terme der Taylor-Reihe
Konstruktion eines Polynompatchs, der die ursprüngliche Auslöschung vermeidet
Begrenzung der Anzahl der Entwicklungsterme (maximal 10 Terme in diesem Papier)

Reparaturbeispiel

Für $\sin(x+\epsilon) - \sin(x)$ :

Taylor-Entwicklung: $\sin(x+\epsilon) = \sin(x) + \cos(x)\epsilon - \frac{\sin(x)}{2!}\epsilon^2 + ...$
Nach Eliminierung des $\sin(x)$ -Terms: $\cos(x)\epsilon - \frac{\sin(x)}{2!}\epsilon^2 + ...$
Relativer Fehler verbessert sich von 1.1095×10^-10 auf 1.6176×10^-16

Methodische Einschränkungen

Taylor-Entwicklung erfordert Funktionskonvergenz am Entwicklungspunkt. Wenn die Funktion am Entwicklungspunkt divergiert (wie in SciPy Issue #3545, wo $norm.ppf(1-q/2)$ gegen 0 divergiert), ist die Methode nicht anwendbar.

Experimentelle Einrichtung

Datensätze

ACESO-Datensatz: 32 Benchmark-Funktionen
- 15 aus früheren Gleitkommafehler-Forschungen, bereits als originalgenauigkeitsreparierbar nachgewiesen
- 17 Varianten-Funktionen mit GSL- und ALGLIB-Bibliotheksaufrufen
Echte Fehler: 5 originalgenauigkeitsreparierbare Fehler, gesammelt von Franco et al.
GSL-Bug-Berichte: Zehn Jahre alte offene Bug-Berichte mit 15 Gleitkommafehlern

Bewertungsmetriken

Messung von Gleitkommafehlern mittels relativen Fehlers: $\left|\frac{Result_{approximate} - Result_{true}}{Result_{true}}\right|$

Bewertung des maximalen absoluten Fehlers und maximalen relativen Fehlers in stabilen und Abklingregionen.

Vergleichsmethoden

Hauptsächlich Vergleich mit ACESO, da es das einzige bestehende Werkzeug ist, das keine hochpräzisen Programme für Erkennung und Reparatur benötigt.

Implementierungsdetails

Umgebung: Docker-Container, Ubuntu 24.04, Intel i9-13900K CPU, 128GB RAM
Taylor-Reihe mit maximal 10 Termen
Konditionszahl-Schwellenwert: 1×10^5
Sampling-Radius: 1×10^-5

Experimentelle Ergebnisse

Hauptergebnisse

RQ1: Bewertung der Erkennungsfähigkeit

Erfolgsquote: OFP-Repair identifiziert erfolgreich alle originalgenauigkeitsreparierbaren Fehler in 32 ACESO-Funktionen
Konditionszahlanalyse: Berechnete Konditionszahlen mit Maximum 1.47, Minimum 0, Durchschnitt 0.31, alle weit unter dem Schwellenwert 10^5
Genauigkeit numerischer Ableitungen: Mit Ausnahme der bj_tan-Funktion liegt der relative Fehler im Bereich 0-0.746 und beeinträchtigt die Erkennung nicht

RQ2: Bewertung der Reparaturleistung

Durchschnittliche Verbesserungen von OFP-Repair im Vergleich zu ACESO auf vier Metriken:

Metrik	OFP-Repair	ACESO	Verbesserungsfaktor
Max. absoluter Fehler in stabiler Region	4.11×10^-16	2.45×10^-13	3 Größenordnungen
Max. relativer Fehler in stabiler Region	7.47×10^-16	2.74×10^-9	7 Größenordnungen
Max. absoluter Fehler in Abklingregion	2.13×10^-16	2.45×10^-13	3 Größenordnungen
Max. relativer Fehler in Abklingregion	3.73×10^-15	5.74×10^-7	8 Größenordnungen

RQ3: Anwendung in der realen Welt

Erkennung: Erfolgreich alle 5 echten originalgenauigkeitsreparierbaren Fehler identifiziert
Reparatur: 3 Fehler erfolgreich repariert, während ACESO nur 1 repariert
Genauigkeit: Reparierte Funktionen zeigen signifikant bessere Genauigkeit als ACESO

Fallstudie: GSL-Bug-Bericht

In zehn Jahre alten ungelösten GSL-Bug-Berichten:

Vollständig gelöste Fälle (3)

gsl_sf_hyperg_0F1-Funktion:

Ursprünglicher relativer Fehler: 1.15×10^198
Konditionszahlen: 3.39×10^-210 und 1.01×10^-225 (beide sehr klein)
Relativer Fehler nach Reparatur: 1.17×10^-27

Teilweise verbesserte Fälle (2)

gsl_sf_gamma_inc_Q-Funktion:

Relativer Fehler von 1.60×10^-6 auf 1.57×10^-7 reduziert

gsl_sf_ellint_P-Funktion:

Durch Umstrukturierung der Berechnung zur Vermeidung von Unterlauf, relativer Fehler auf 1.91×10^-9 reduziert

Schlussfolgerung und Diskussion

Hauptschlussfolgerungen

Effektive Erkennung: OFP-Repair kann originalgenauigkeitsreparierbare Fehler genau identifizieren, ohne hochpräzise Programme zu benötigen
Überlegene Reparatur: Im Vergleich zu bestehenden Methoden werden Verbesserungen in der Größenordnung bei der Genauigkeit erreicht
Praktischer Wert: Erfolgreiche Anwendung in echten Projekten mit Anerkennung durch Entwickler

Einschränkungen

Konvergenzanforderung: Taylor-Entwicklung erfordert Funktionskonvergenz am Entwicklungspunkt
Verzweigungsbehandlung: Verschiedene Programmverzweigungen erfordern möglicherweise unterschiedliche Behandlungsstrategien
Komplexe Funktionen: Für extrem komplexe mathematische Funktionen können mehr Entwicklungsterme erforderlich sein

Zukünftige Richtungen

Erweiterung der Methode auf breitere ungelöste Fehler
Optimierung der Strategien zur Auswahl der Anzahl der Taylor-Terme
Alternative Lösungen für Funktionsdivergenzfälle

Tiefgreifende Bewertung

Stärken

Theoretischer Beitrag: Etablierung einer Erkennungstheorie für originalgenauigkeitsreparierbare Fehler basierend auf Konditionszahlen
Hohe Praktikabilität: Keine Abhängigkeit von hochpräzisen Programmen, reduzierte Nutzungsschwelle
Signifikante Effekte: Verbesserungen in der Größenordnung auf mehreren Metriken
Umfassende Validierung: Vollständige Validierung von akademischen Benchmarks bis zu echten Anwendungen
Klare Darstellung: Genaue Beschreibung technischer Details, angemessenes Experimentdesign

Mängel

Anwendungsbereich: Nur auf originalgenauigkeitsreparierbare Fehler anwendbar, ineffektiv bei hochgenauigkeitsabhängigen Fehlern
Funktionsbeschränkungen: Konvergenzanforderungen der Taylor-Entwicklung begrenzen die Universalität der Methode
Parameterauswahl: Auswahl des Konditionszahl-Schwellenwerts und der Taylor-Termanzahl mangelt es an theoretischer Anleitung
Skalierbarkeit: Anwendbarkeit auf große komplexe Programme erfordert weitere Verifikation

Einfluss

Akademischer Wert: Bietet neuen theoretischen Rahmen und praktisches Werkzeug für das Gleitkommafehler-Reparaturfeld
Industrielle Anwendung: Positive Rückmeldung von GSL-Entwicklern zeigt praktisches Anwendungspotenzial
Reproduzierbarkeit: Bereitstellung eines vollständigen Reproduktionspakets fördert nachfolgende Forschung

Anwendungsszenarien

Wissenschaftliche Rechenbibliotheken: Fehlerreparatur in GSL, NumPy, SciPy und anderen numerischen Rechenbibliotheken
Kritische Systeme: Gleitkommagenauigkeitsprobleme in Luft- und Raumfahrt- sowie Finanzsystemen
Bildungsforschung: Als Lehrinstrument für Gleitkommafehleranalyse und -reparatur

Literaturverzeichnis

Das Papier zitiert 36 relevante Literaturquellen, die Gleitkommafehler-Erkennung, -Reparatur, numerische Analyse und andere Aspekte abdecken und eine solide theoretische Grundlage für die Forschung bieten. Wichtige Referenzen umfassen systematische Forschungen zu numerischen Bugs von Franco et al., repräsentative Reparaturwerkzeuge wie ACESO und AutoRNP sowie relevante mathematische theoretische Grundlagen.

Gesamtbewertung: Dies ist ein hochqualitatives Softwaretechnik-Forschungspapier, das eine innovative Lösung für das wichtige Problem der Gleitkommafehler-Reparatur in Programmen bietet. Die Methode hat eine solide theoretische Grundlage, umfassende experimentelle Validierung und signifikante praktische Anwendungseffekte. Obwohl es gewisse Einschränkungen gibt, leistet es wichtige Beiträge zur Entwicklung dieses Feldes.