2025-11-12T00:52:30.352910

OFP-Repair: Repairing Floating-point Errors via Original-Precision Arithmetic

Tan, Ding, Chen et al.

Errors in floating-point programs can lead to severe consequences, particularly in critical domains such as military, aerospace, and financial systems, making their repair a crucial research problem. In practice, some errors can be fixed using original-precision arithmetic, while others require high-precision computation. Developers often avoid addressing the latter due to excessive computational resources required. However, they sometimes struggle to distinguish between these two types of errors, and existing repair tools fail to assist in this differentiation. Most current repair tools rely on high-precision implementations, which are time-consuming to develop and demand specialized expertise. Although a few tools do not require high-precision programs, they can only fix a limited subset of errors or produce suboptimal results. To address these challenges, we propose a novel method, named OFP-Repair.On ACESO's dataset, our patches achieve improvements of three, seven, three, and eight orders of magnitude across four accuracy metrics. In real-world cases, our method successfully detects all five original-precision-repairable errors and fixes three, whereas ACESO only repairs one. Notably, these results are based on verified data and do not fully capture the potential of OFP-Repair. To further validate our method, we deploy it on a decade-old open bug report from GNU Scientific Library (GSL), successfully repairing five out of 15 bugs. The developers have expressed interest in our method and are considering integrating our tool into their development workflow. We are currently working on applying our patches to GSL. The results are highly encouraging, demonstrating the practical applicability of our technique.

academic

OFP-Repair: Repairing Floating-point Errors via Original-Precision Arithmetic

基本信息

论文ID: 2510.09938
标题: OFP-Repair: Repairing Floating-point Errors via Original-Precision Arithmetic
作者: Youshuai Tan, Zishuo Ding, Jinfu Chen, Weiyi Shang
分类: cs.SE (软件工程)
发表时间/会议: Conference'17, Washington, DC, USA (2025)
论文链接: https://arxiv.org/abs/2510.09938

摘要

浮点程序中的错误可能导致严重后果，特别是在军事、航空航天和金融系统等关键领域。实践中，一些错误可以通过原精度算术修复，而另一些则需要高精度计算。开发者通常避免使用高精度方法，因为其需要大量计算资源。然而，开发者往往难以区分这两类错误，现有修复工具也无法帮助进行此类区分。为解决这些挑战，本文提出了OFP-Repair方法，通过计算程序相对输入的条件数来识别原精度可修复错误，并使用级数展开构建统一的修复框架。实验结果显示，该方法在四个精度指标上分别实现了3、7、3、8个数量级的改进。

研究背景与动机

问题定义

浮点程序错误在关键系统中可能导致灾难性后果，如Patriot导弹系统故障、Ariane 5火箭爆炸等。现有研究表明，浮点错误主要分为两类：

原精度可修复错误：可通过重构数值表达式在原精度下修复
高精度依赖错误：必须使用高精度浮点算术才能修复

现有方法的局限性

论文识别了三个主要限制：

限制1：检测和修复过程都需要高精度程序，而将原程序转换为高精度版本需要深厚的数学和数值分析知识
限制2：缺乏针对原精度可修复错误的统一修复范式，现有工具只能处理部分此类错误
限制3：缺乏对此类错误的诊断能力，开发者无法判断错误是否可通过原精度算术修复

研究动机

Franco等人的研究显示，开发者更倾向于使用原精度修复方案，因为高精度方案计算成本高昂。例如，NumPy issue #1063因高精度成本过高而被关闭。然而，现有工具无法帮助开发者区分这两类错误类型。

核心贡献

提出OFP-Repair方法：首个能够有效检测和修复原精度可修复错误的统一框架
理论基础建立：基于条件数理论和Taylor级数展开的原精度错误检测与修复机制
广泛实验验证：在ACESO数据集、真实世界错误和十年未解决的GSL bug报告上验证方法有效性
实际应用价值：成功修复GSL中5个长期未解决的bug，获得开发者认可

方法详解

任务定义

输入：包含浮点错误的程序和触发大误差的输入范围
输出：
1. 错误类型判断（原精度可修复 vs 高精度依赖）
2. 原精度可修复错误的修复补丁
约束：不依赖高精度程序实现

理论基础

大误差来源分析

论文证明了显著浮点错误主要源于抵消（cancellation）效应。当两个近似相等的浮点数相减时，会导致有效精度位数大幅减少。例如：

x = 3.14159265358973, y = 3.14159265358972
理论差值：1×10^-14
浮点计算结果：1.021405182655144×10^-14
相对误差：约2.14%

程序多项式表示

基于以下两个定理：

算术运算保持连续性定理：连续函数的算术运算仍保持连续性
Weierstrass逼近定理：连续函数可用多项式任意逼近

论文证明浮点程序可在每个分支域内转换为多项式表示。

检测算法（步骤1）

设计思路

使用条件数理论评估输入扰动对输出的影响： $\left|\frac{f(x+\Delta x)-f(x)}{f(x)}\right| \approx \left|\frac{\Delta x}{x}\right| \cdot \left|\frac{xf'(x)}{f(x)}\right|$

其中 $\left|\frac{xf'(x)}{f(x)}\right|$ 为条件数。

检测流程

使用ATOMU检测显著浮点错误
对每个错误，计算程序相对输入的条件数
使用数值微分估算导数： $f'(x) \approx \frac{f(x+h)-f(x)}{h}$
若条件数小于阈值（如10^5），则判定为原精度可修复错误

示例分析

对于函数 $\sin(x+\epsilon) - \sin(x)$ ：

相对 $\sin(x+\epsilon)$ 的条件数：9.0132×10^9（很大）
相对输入 $x$ 的条件数：3.40（很小）
结论：该错误可通过原精度算术修复

修复算法（步骤2）

设计原理

使用Taylor级数展开将程序转换为无抵消的多项式形式： $f(x) = \sum_{n=0}^{\infty} \frac{f^{(n)}(a)}{n!}(x-a)^n$

修复流程

选择展开点（通常为引起大误差的点附近）
计算Taylor级数的前若干项
构造避免原始抵消的多项式补丁
限制展开项数（论文中最多10项）

修复示例

对于 $\sin(x+\epsilon) - \sin(x)$ ：

Taylor展开： $\sin(x+\epsilon) = \sin(x) + \cos(x)\epsilon - \frac{\sin(x)}{2!}\epsilon^2 + ...$
消除 $\sin(x)$ 项后： $\cos(x)\epsilon - \frac{\sin(x)}{2!}\epsilon^2 + ...$
相对误差从 1.1095×10^-10 改善到 1.6176×10^-16

方法局限性

Taylor展开要求函数在展开点收敛。当函数在展开点发散时（如SciPy issue #3545中 $norm.ppf(1-q/2)$ 当 $q$ 趋近于0时），方法不适用。

实验设置

数据集

ACESO数据集：32个基准函数
- 15个来自先前浮点错误研究，已被证明可用原精度修复
- 17个包含GSL和ALGLIB库调用的变体函数
真实世界错误：Franco等人收集的5个原精度可修复错误
GSL bug报告：十年前的开放bug报告，包含15个浮点错误

评价指标

使用相对误差衡量浮点误差： $\left|\frac{Result_{approximate} - Result_{true}}{Result_{true}}\right|$

分别在稳定区域和衰减区域评估最大绝对误差和最大相对误差。

对比方法

主要与ACESO对比，因为它是唯一不需要高精度程序进行检测和修复的现有工具。

实现细节

环境：Docker容器，Ubuntu 24.04，Intel i9-13900K CPU，128GB RAM
Taylor级数最多保留10项
条件数阈值：1×10^5
采样半径：1×10^-5

实验结果

主要结果

RQ1：检测能力评估

成功率：在32个ACESO函数中，OFP-Repair成功识别所有原精度可修复错误
条件数分析：计算得到的条件数最大值1.47，最小值0，平均值0.31，均远小于阈值10^5
数值导数精度：除bj_tan函数外，相对误差范围0-0.746，不影响检测效果

RQ2：修复性能评估

与ACESO相比，OFP-Repair在四个指标上的平均改进：

指标	OFP-Repair	ACESO	改进倍数
稳定区域最大绝对误差	4.11×10^-16	2.45×10^-13	3个数量级
稳定区域最大相对误差	7.47×10^-16	2.74×10^-9	7个数量级
衰减区域最大绝对误差	2.13×10^-16	2.45×10^-13	3个数量级
衰减区域最大相对误差	3.73×10^-15	5.74×10^-7	8个数量级