Gaussian Processes (GPs) are widely recognized as powerful non-parametric models for regression and classification. Traditional GP frameworks predominantly operate under the assumption that the inputs are either accurately known or subject to zero-mean noise. However, several real-world applications such as mobile sensors have imperfect localization, leading to inputs with biased errors. These biases can typically be estimated through measurements collected over time using, for example, Kalman filters. To avoid recomputation of the entire GP model when better estimates of the inputs used in the training data become available, we introduce a technique for updating a trained GP model to incorporate updated estimates of the inputs. By leveraging the differentiability of the mean and covariance functions derived from the squared exponential kernel, a second-order correction algorithm is developed to update the trained GP models. Precomputed Jacobians and Hessians of kernels enable real-time refinement of the mean and covariance predictions. The efficacy of the developed approach is demonstrated using two simulation studies, with error analyses revealing improvements in both predictive accuracy and uncertainty quantification.
- 论文ID: 2504.18463
- 标题: A Taylor Series Approach to Correction of Input Errors in Gaussian Process Regression
- 作者: Muzaffar Qureshi, Tochukwu Elijah Ogri, Zachary I. Bell, Wanjiku A. Makumi, Rushikesh Kamalapurkar
- 分类: eess.SY (Systems and Control), cs.RO (Robotics), cs.SY (Systems and Control)
- 发表时间: 2025年4月25日
- 论文链接: https://arxiv.org/abs/2504.18463
本文针对高斯过程回归中输入误差的修正问题,提出了一种基于泰勒级数的方法。传统GP框架假设输入要么精确已知,要么服从零均值噪声,但在移动传感器等实际应用中,由于定位不准确导致输入存在有偏误差。为避免在获得更好的输入估计时重新计算整个GP模型,本文利用平方指数核的均值和协方差函数的可微性,开发了二阶修正算法来更新训练好的GP模型。通过预计算的雅可比矩阵和海塞矩阵,实现了均值和协方差预测的实时细化。
- 核心问题:在实际应用中,移动传感器由于定位误差导致GP回归的输入数据不准确,影响模型性能
- 重要性:准确的场映射在环境监测、搜救任务、自主水下探索等领域至关重要
- 现有方法局限性:
- 传统方法假设输入精确或仅有零均值噪声
- 异方差GP主要关注输出方差调整,依赖确定性输入测量
- 噪声输入GP (NIGP)的局部线性近似在高非线性函数下可能失效
- 扩展卡尔曼滤波在强非线性或扰动下性能下降
在GPS信号不可用或不可靠的环境中,定位不确定性会传播到GP模型中,导致预测性能下降。现有研究主要分析输入不确定性对GP预测的影响,但缺乏更新GP模型以适应修正输入估计的方法。
- 开发了一种GP模型更新技术:通过预计算的GP均值和协方差函数的高阶导数,集成定位引起的输入误差修正
- 提供了详细的预测误差和计算时间分析:包括理论收敛性分析和计算复杂度评估
- 广泛的蒙特卡洛仿真验证:通过两个不同案例展示了方法的有效性
- 实时更新能力:避免重新训练或重新访问测量位置的需求
考虑配备传感器的智能体在域 X⊂Rp 中访问测量位置集合,创建标量场 h:X→R 的映射。场可用GP建模:
hˉ∼GP(μ,Σ)
其中 μ:Rp→R 是均值函数,Σ:Rp×Rp→R 是协方差函数。
选择平方指数协方差核:
k(x^,x^′):=α2exp(−2β2∣∣x^−x^′∣∣2)
其中 α 表示幅度,β 是长度尺度。
对于查询位置 xe,修正后的均值向量通过二阶泰勒展开表示:
M(X^,xe):=M^(X^,xe)+∑i=1n∂x^i∂M^(X^,xe)δi+21∑i=1n∂x^i2∂2M^(X^,xe)δi2
其中 δi 表示第i个测量位置的扰动。
均值函数的雅可比矩阵:
JM:=[∂x^1∂M^,∂x^2∂M^,⋯,∂x^n∂M^]
海塞矩阵 HM∈Rn×n 包含所有二阶偏导数。
协方差矩阵的修正遵循类似的泰勒展开:
S(X^,xe):=S^(X^,xe)+∑i=1n∂x^i∂S^(X^,xe)δi+21∑i=1n∂x^i2∂2S^(X^,xe)δi2
- 离线-在线框架:
- 离线阶段:预计算均值和协方差函数的高阶导数
- 在线阶段:使用存储的导数和输入误差信息实时更新GP模型
- 可微性利用:充分利用平方指数核的无限可微性,保证所有导数的存在性和连续性
- 计算效率:在线更新的计算复杂度为O(n),相比完整GP重计算的O(n³)有显著改进
定理1:如果核函数k在输入域X上是解析的,则均值函数 M^ 也是实解析的,可表示为泰勒级数展开,且在X的任何紧子集上一致收敛。
定理2:给定期望近似精度ε > 0,泰勒级数展开中所需的最小导数阶数为:
N=⌈log(β)log(Lmε)⌉
其中 Lm 是约束(N+1)阶导数张量的常数。
- 函数:h1(x)=sin(2πx),x∈[0,1]
- 测量位置:X^={0,0.1,0.2,...,1}
- 核参数:α=0.1,β=0.2
- 扰动:高斯噪声 ε∼N(0,0.012),误差向量 δi∼[0,0.03]
- 函数:h2(x,y)=sin(2πx)⋅cos(2πy),(x,y)∈[0,1]2
- 扰动:固定偏差 δi=0.1(模拟传感器偏差)
- 预测精度:修正GP与理想GP之间的绝对误差
- 计算时间:修正过程与完整GP重计算的时间对比
- 不确定性量化:协方差估计的改进程度
- 基准模型:在真实测量位置训练的理想GP模型
- 损坏模型:在计划位置训练但使用实际测量值的GP模型
- 修正模型:使用提出方法修正的GP模型
根据1000次仿真的平均结果:
| 指标 | 一维仿真 | 二维仿真 |
|---|
| 损坏GP误差 | 1.2653 | 1.939 |
| 修正GP误差 | 1.055 | 1.2296 |
| 改进百分比 | 79.27% | 71.785% |
| 方法 | 一维时间(秒) | 二维时间(秒) |
|---|
| 损坏GP | 0.019 | 0.023 |
| 修正GP | 0.000022 | 0.000036 |
- 显著的精度提升:在两个测试场景中,修正方法都实现了70%以上的误差减少
- 计算效率大幅提升:修正过程比完整GP计算快约1000倍
- 不确定性量化改进:协方差估计也得到显著改善
- 实时适应能力:方法支持在线更新,无需重新训练
- 输入不确定性处理:
- Girard等人的解析方法(假设输入分布已知)
- Candela等人的迭代预测框架
- 异方差GP回归:
- Kersting等人的变噪声分布处理
- 主要关注输出方差调整
- 噪声输入GP (NIGP):
- 状态估计方法:
相比现有方法,本文首次提出了更新已训练GP模型以适应修正输入估计的技术,填补了该领域的空白。
- 有效性验证:提出的基于泰勒级数的修正方法在两个仿真研究中都显示出显著的误差减少和计算效率提升
- 理论基础:通过收敛性分析证明了方法的理论可靠性
- 实用价值:方法特别适用于动态环境中的实时修正任务
- 完美扰动假设:方法假设扰动 δi 完全已知,意味着智能体的完全状态可观测性
- 部分观测挑战:实际场景中可能只有部分状态测量可用,需要额外的估计策略
- 可扩展性问题:对于大型GP模型,导数矩阵的规模可能不利于扩展
- 核函数限制:当前方法专门针对平方指数核设计
- 近似技术:开发降维方法以确保大规模应用的计算可行性
- 部分观测处理:扩展方法以处理不完全状态信息的场景
- 多核支持:将方法扩展到其他类型的核函数
- 实际部署:在真实机器人系统中验证方法的实用性
- 方法创新性强:首次提出GP模型的在线修正技术,解决了实际应用中的重要问题
- 理论基础扎实:提供了完整的收敛性分析和误差界限
- 计算效率显著:O(n)的在线复杂度相比O(n³)的重计算有巨大优势
- 实验充分:通过一维和二维案例全面验证了方法有效性
- 实用价值高:特别适合GPS拒止环境下的移动机器人应用
- 假设条件严格:完美扰动信息的假设在实际应用中难以满足
- 核函数局限:仅针对平方指数核进行了详细分析
- 大规模适用性:对于高维或大规模问题的可扩展性分析不足
- 实际验证缺失:缺乏真实机器人系统上的实验验证
- 学术贡献:为GP回归的输入误差处理提供了新的理论框架和实用方法
- 应用前景:在自主导航、环境监测、搜救等领域有广泛应用潜力
- 可复现性:方法描述详细,算法清晰,具有良好的可复现性
- 移动机器人导航:GPS拒止环境下的场映射和导航
- 环境监测:传感器网络中的数据融合和校正
- 自主探索:未知环境中的在线学习和适应
- 工业检测:需要实时校正的质量控制系统
论文引用了21篇重要参考文献,涵盖了GP理论、机器人导航、状态估计等相关领域的经典和前沿工作,为研究提供了坚实的理论基础。
总体评价:这是一篇高质量的技术论文,提出了创新的GP模型在线修正方法,具有重要的理论价值和实际应用潜力。方法在计算效率和预测精度方面都取得了显著改进,为相关领域的研究和应用提供了有价值的贡献。